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长 期 以 来 ， 土 地 覆盖 变化 的 研究 一 直 是 全 球 环境 研究 的 热点 ， 
无 论 从 社会 经 济 角 度 还 是 从 生态 环境 角度 均 具有 重要 的 意义 。 为 了 
全 面 掌握 土地 覆盖 变化 信息 ， 人 迫切 需要 使 用 切实 有 效 的 方法 实现 土 
地 覆盖 宏观 、 动 态 、 大 尺度 的 制图 与 监测 ， 遥 感 技术 的 迅 狐 发展 为 
这 一 需求 提供 了 可 能 。 然 而 ， 目 前 遥感 信息 处 理 和 分 类 的 水 平 大 大 
滞后 于 遥感 影像 获取 技术 的 发 展 。 因 此 ， 研 究 新 理论 、 新 方法 以 提 
高 遥感 信息 的 处 理 能 力 具 有 十 分 重要 的 意义 和 应 用 前 景 。 

支持 向 量 机 (Support Vector Machines，SVM) 是 近年 来 机 器 学 习 
与 模式 识别 领域 新 的 研究 焦点 ， 它 具有 结构 简单 、 适 应 性 强 、 全 局 
最 优等 特点 ， 能 较 好 地 解决 高 维特 征 、 非 线性 ， 过 学 习 与 不 确定 性 
等 问题 ， 广 泛 地 应 用 于 土地 覆盖 遥感 分 类 。 尽 管 SVM 在 遥感 信息 获 
取 中 取得 了 很 好 的 效果 ， 但 仍 存在 有 待 改 进 和 完善 之 处 ， 主 要 表现 
在 以 下 两 方面 ,参数 选择 的 问题 ， 即 不 准确 的 分 类 参数 常常 影响 
分 类 器 的 分 类 精度 ，@ 样 本 不 足 且 代 表 性 不 好 的 问题 ， 即 当 训 练 样 
本 集 远 远 小 于 测试 样本 集 时 ， 即 便 SVM 具 有 较 强 的 泛 化 性 ， 也 难以 
给 出 令 人 满意 的 结果 。 围 绕 这 些 问 题 ， 本 书 开展 了 如 下 工作 : 
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1. 选择 图 们 江 下 游 ， 中 、 朝 、 俄 交界 处 作为 研究 对 象 。 以 行列 
号 115-30 一 景 、 近 20 年 的 6 幅 不 同时 相 的 Landsat ETM/TM 影 像 作 为 
研究 材料 。 分 别 讨论 本 书 所 采用 的 影像 合成 方式 、 特 征 采集 方法 、 
土地 覆盖 分 类 依据 ， 以 及 特征 选取 方法 ， 为 进一步 研究 分 类 方法 提 
供 必 要 的 数据 材料 。 

2. 针对 SVM 分 类 过 程 中 核 函 数 选择 及 参数 设置 不 准确 的 缺 
点 ， 提 出 一 种 基于 自 适应 变异 粒子 群 优化 SVM 参数 模型 (Adaptive 
Mutation Particle Swarm Optimization SVM, AMPSO-SVM). 
AMPSO 在 运行 过 程 中 根据 群体 适应 度 方差 以 及 最 优 解 的 大 小 来 
确定 当前 最 佳 粒子 的 变异 概率 。 与 传统 粒子 群 (Particle Swarm 
Optimization，PSO) 优 化 SVM 参 数 模 型 (PSO-SVM) 相 比 ，AMPSO- 
SVM 能 够 快速 摆脱 局 部 搜索 的 束缚 ， 提 高 全 局 搜索 的 性 能 ， 克 服 
早熟 收敛 造成 分 类 参数 寻找 不 准确 的 缺点 ， 同 时 保持 了 种 群 的 多 样 
性 。 最 后 应 用 该 模型 进行 多 光谱 遥感 影像 的 土地 覆盖 分 类 实验 ， 
并 与 SVM 分 类 方法 、PSO-SVM 分 类 方法 进行 对 比 。 分 类 精度 从 传 
统 PSO-SVM 的 91.50% 提 高 到 93.59%，Kappa 系 数 由 0.890 3 提高 为 
0.9175。c 和 ?的 取 值 得 到 的 分 类 结果 明显 优 于 SVM 的 手工 设置 值 
100 和 0.143 所 得 到 的 结果 (分 类 精度 87.07%，Kappa 系 数 0.837 2)。 结 
果 表 明 ，AMPSO-SVM 模 型 有 效 地 提高 了 遥感 影像 的 分 类 精度 。 

3. 提出 了 一 个 新 的 自 训练 半 监 督 支持 向 量 机 方法 (PS3VM)。 自 
训练 半 监 督 算法 最 大 的 次 端 在 于 “错误 累积 ”现象 ， 即 在 学 习 过 程 


中 ， 一 旦 某 个 分 类 出 错 ， 将 导致 这 个 错误 被 继续 学 习 与 加 强 。 为 了 
克服 这 一 现象 ， 本 书 在 自 训 练 半 监督 SVM(S3VMD) 的 基础 上 引入 两 
个 算法 : 四 从 分 类 器 的 构造 角度 ， 利 用 自 适 应 变异 粒子 群 算法 对 
SVM 参数 优化 ， 以 提高 单个 分 类 器 的 分 类 精度 ;四 在 未 标记 样本 
的 标注 阶段 ， 采 用 Gustafson-Kessel 模 糊 聚 类 算法 (GKclusb 将 最 接 
近 样 本 的 有 效 无 标签 样本 作为 标注 对 象 ， 以 控制 错误 信息 的 输入 。 
为 了 测试 所 提 模 型 的 有 效 性 ， 分 别针 对 遥感 的 数字 化 集合 和 影像 集 
合 进行 分 类 实验 ， 并 与 AMPSO-SVM( 简 称 PSVM) 监 督 分 类 方法 、 
未 改进 自 训 练 S3VM 方 法 进行 对 比 实验 ， 由 PS3VM 产 生 的 分 类 精度 
(95.10%) 分 别 比 S3VM(93.06%) 高 出 2.04%; 比 PSVM(90.81%) 高 出 
4.29%。 实 验 结果 一 方面 说 明了 已 标记 样本 和 未 标记 样本 的 用 量 比 
例 必须 满足 一 定 的 阔 值 要 求 (1:3)， 才 能 产生 最 小 的 泛 化 误差 ， 另 一 
方面 证 实 了 利用 所 提出 学 习 框架 能 够 获得 较 好 的 分 类 精度 。 

4. 对 于 样本 不 足 且 代 表 不 好 而 造成 的 小 样本 问题 ， 学 者 们 普遍 
采用 半 监 督学 习 和 集成 学 习 两 种 范式 对 SVM 进行 改进 。 然 而 ， 集 
成 学 习 与 半 监 督学 习 之 间 存 在 许多 互补 性 ， 且 二 者 的 混合 范式 ( 即 
半 监 督 集成 ) 可 以 更 大 程度 地 改进 学 习 系 统 的 泛 化 能 力 。 因 此 ， 本 
文 设计 了 一 种 新 的 半 监 督 集成 方案 (EPS3VM)，PS3VM 半 监督 方法 
利用 未 标记 数据 有 效 地 应 对 训练 样本 不 足 的 同时 也 产生 若干 性 能 差 
异 的 个 体 分 类 器 ， 将 这 些 个 体 分 类 器 采用 加 权 集 成 策略 进一步 提 
高 分 类 模型 的 泛 化 能 力 。 为 了 测试 其 性 能 ， 应 用 该 模型 进行 多 光谱 
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遥感 影像 的 土地 覆盖 分 类 实验 ， 并 与 其 相关 算法 进行 对 比 。 分 类 
精度 从 92.16%(PS3VM) 提 高 到 96.88%，Kappa 系 数 由 0.901 0 提高 为 
0.960 6。 结 果 表明 ，EPS3VM 克 服 传 统 SVM 参 数 选择 不 准确 的 同时 
有 效 地 应 对 了 小 样本 问题 ， 分 类 性 能 更 优 。 

本 书 是 在 吉林 财经 大 学 资助 下 ， 国 家 自然 科学 基金 项 目 
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20100507)、 吉 林 省 教育 厅 十 二 五 重点 规划 项 目 (2012185)、 吉 林 省 高 
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1.1.1 土地 覆盖 


土地 覆盖 变化 是 全 球 环境 变化 研究 的 热点 和 前 沿 ， 是 国际 地 
圈 一 生物 圈 计 划 (IGBP) 的 核心 研究 内 容 之 一 ， 无 论 从 社会 经 济 角度 
还 是 从 生态 环境 角度 均 具有 重要 的 意义 。 土 地 覆盖 真实 地 反映 了 地 
表 履 盖 情 况 ， 它 并 不 是 单一 的 植被 及 土地 类 型 ， 而 是 土地 利用 类 型 
及 其 所 具有 的 一 系列 自然 属性 特征 的 综合 体 ， 包 括 与 土地 覆盖 类 型 
密切 相关 的 生态 环境 要 素 ， 如 植被 所 处 的 生态 区 域 、 地 形 与 气候 条 
件 以 及 土地 利用 状况 等 所 。 

自 20 世 纪 80 年 代 以 来 ， 随 着 臭氧 层 的 破坏 、 全 球 变 暖 、 土 地 退 
化 、 土 地 荒漠 化 的 蔓延 、 酸 雨 频繁 发 生 等 全 球 性 环境 问题 的 不 断 涌 
现 ， 人 们 逐渐 认识 到 土地 利用 与 土地 覆盖 变化 是 气候 、 生 态 过程 、 
生物 多 样 性 、 生 物化 学 循环 ， 乃 至 全 球 变化 的 主要 原因 中 中 。 具 体 
表现 在 以 下 几 个 方面 。 

(1) 土地 覆盖 变化 对 人 类 资源 利用 的 影响 。 由 于 土地 覆盖 变化 
使 得 水 资源 、 耕 地 资源 、 草 场 资源 、 森 林 资 源 的 存量 发 生变 化 ， 从 
而 对 人 类 社会 产生 影响 ， 并 对 人 类 环境 的 安全 造成 威胁 中 中。 

(2) 土地 覆盖 变化 对 土壤 的 影响 。 土 地 覆盖 的 变化 使 得 土壤 养 
分 失衡 、 营 养 元 素 衰 竭 、 有 机 质 含量 变化 、 水 分 循环 改变 中 。 

(3) 土地 覆盖 变化 对 全 球 气候 变化 的 影响 。 地 表 反 照 率 、 粗 糙 
度 、 植 被 叶 面积 指数 及 植被 覆盖 度 等 变化 造成 降水 量 减 少 和 温度 增 
加 WT?"， 同 样 也 引起 局 地 区 域 气 候 变 化 ， 如 城市 热岛 现象 ， 城 市 酸 
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雨 等 3。 

(4) 土地 覆盖 变化 对 生态 系统 的 影响 ， 集 中 于 生态 系统 功能 方 
面 的 物质 循环 和 能 量 流动 。 如 在 温度 、CO; 浓 度 及 降水 量 等 自然 环境 
要 素 发 生变 化 的 情况 下 ， 生 态 系统 的 初级 生产 量 会 受到 影响 人 1。 

(5) 土地 覆盖 变化 对 水 文 和 地 表 、 地 下 径流 的 影响 。 表 现在 其 
改变 所 造成 的 气候 变化 ， 汛 期 流量 增加 ， 枯 水 期 流量 减少 ， 水 中 泥 
沙 含量 变化 ， 径 流 极 值 变化 ， 进 而 影响 地 下 水 的 补给 ， 产 生 多 种 水 
cA rts, 

(6) 土地 覆盖 变化 还 可 能 加 剧 自然 灾害 。 如 森林 的 砍伐 、 植 被 
覆盖 度 的 降低 使 得 土壤 侵蚀 面积 增 大 ， 洪 涝 灾害 加 剧 "Y"”。 

因此 ， 有 效 地 管理 和 保护 日 益 稀缺 的 土地 资源 ， 探 索 土 地 覆盖 
动态 变化 过 程 ， 解 析 变 化 的 驱动 因素 ， 抑 制 全 球 环境 恶劣 变化 等 诸 
多 问题 一 直 是 地 学 领域 学 者 关注 的 热点 ， 而 这 些 问 题 的 解决 依赖 于 
准确 、 实 时 地 获取 土地 覆盖 动态 变化 信息 。 


1.1.2. ”遥感 技术 


遥感 RS(Remote Sensing) 是 20 世 纪 60 年 代 兴 起 并 迅速 发 展 起 来 的 
一 门 包括 航天 技术 、 计 算 机 技术 、 图 像 处 理 等 综合 性 的 探测 技术 中 。 
它 是 一 种 远离 目标 ， 在 不 与 目标 直接 接触 的 情况 下 ， 通 过 某 种 平台 
上 装载 的 传感器 获取 其 特征 信息 ， 然 后 对 其 所 获得 的 信息 进行 提 
取 、 判 定 、 加 工 处 理 及 应 用 分 析 c。 遥 感 技术 能 大 面积 、 重 复 地 获 
取 区 域 多 波段 、 多 时 相信 息 ， 为 大 面积 、 实 时 、 动 态 监测 土地 覆盖 
动态 变化 提供 了 可 能 ， 是 调查 、 监 测 和 分 析 最 好 的 手段 之 一 中 。 从 
此 ， 人 类 对 地 球 表层 的 理解 进入 一 个 崭 新 的 阶段 。 然 而 ， 由 于 地 球 
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系统 的 复杂 性 和 开放 性 ， 遥 感 信息 在 进行 地 学 空间 分 析 和 反 演 过 程 
中 具有 模糊 性 和 多 解 性 的 特点 ， 即 复杂 性 和 不 确定 性 PI。 表现 为 
不 同 土地 覆盖 类 型 经 常 有 相似 的 光谱 特性 (异物 同 谱 现象 )， 以 及 相 
同 土地 覆盖 类 型 由 于 地 形 、 光 照 条 件 等 的 影响 会 具有 不 同 的 光谱 特 
性 ( 同 物 异 谱 现象 )， 这 些 增 大 了 土地 覆盖 信息 的 提取 难度 。 因 此 ， 
在 研究 不 同 土地 覆盖 类 型 的 光谱 特征 和 空间 分 布 特征 的 同时 ， 进 
一 步 研究 土地 覆盖 分 类 策略 与 方法 ， 将 有 助 于 土地 覆盖 信息 的 有 
效 获取 。 


1.1.3 ”机 器 学 习 


机 器 学 习 是 人 工 智 能 的 一 个 重要 领域 ， 源 自 于 统计 模型 拟 合 。 
机 器 学 习 通 过 采用 推理 及 样本 学 习 等 方式 从 数据 中 获得 相应 的 理 
论 ， 尤 其 适合 解决 “噪声 ”模式 及 大 规模 数据 集 等 问题 。 在 大 样 
本 、 多 向 量 及 不 确定 数据 分 析 工 作 中 发 挥 着 日 益 重 要 的 作用 P39P7。 

根据 学 习 方式 的 不 同 ， 机 器 学 习 方 法 可 分 为 以 下 几 类 : Oki 
督学 习 (Supervised Learning)， 利 用 一 组 已 知 类 别 的 样本 调整 分 类 器 
的 参数 ， 使 其 达到 所 要 求 性 能 的 过 程 ，@ 无 监督 学 习 (Unsupervised 
Learning)， 是 指 所 有 样本 的 类 别 都 是 未 知 的 ， 算 法 通过 数据 特征 自 
动产 生 类 别 属性 ，@ 半 监督 学 习 (Semi-supervised Learning)， 介 于 监 
督学 习 和 无 监督 学 习 之 间 ， 所 需 样本 既 包括 已 知 类 别 样本 又 包括 未 
知 类 别 样本 ， 通 过 挖掘 未 知 类 别 样本 中 所 蕴涵 的 固有 结构 信息 ， 来 
对 已 知 类 别 样本 可 能 因 代表 性 不 好 而 造成 的 拟 合 分 类 器 有 偏差 的 情 
WITRE: DORRE Ensemble Learning)， 综 合 多 个 同 构 或 异 构 
学 习 机 对 同一 个 问题 进行 学 习 进而 提高 分 类 器 的 泛 化 能 力 。 
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当前 ， 许 多 机 器 学 习 技术 被 广泛 地 应 用 于 遥感 影像 的 分 类 ， 
例如 最 大 似 然 法 、K-means 算 法 、 神 经 网 络 、 决 策 树 、 支 持 向 量 机 
等 中 人 9。 其 中 ，Vapnik 提 出 的 支持 向 量 机 (Support Vector Machines, 
SVM) 监 督 分 类 技术 是 近年 来 模式 识别 与 机 器 学 习 领域 一 个 新 的 研 
究 热点 9650， 非常 适合 处 理 高 维 、 复 杂 的 小 样本 多 维 数 据 分 
类 FT 的 ， 广 泛 应 用 于 土地 覆盖 分 类 S389、 森林 类 型 识别 ?99、 农 
业 作物 监测 中、 道路 信息 提取 四、 图 像 分 割 中 等 领域 。 尽 管 SVM 在 
遥感 信息 提取 中 取得 了 很 好 的 效果 ， 但 是 仍然 存在 需要 改进 和 完善 
之 处 。 主 要 表现 在 以 下 两 方面 。 

(1) 参数 选择 的 问题 ， 分 类 参数 的 选择 没有 特别 好 的 办 法 ， 应 
用 时 不 容易 找到 最 优 分 类 参数 。 

(2) 样本 不 足 且 代表 不 好 的 问题 ， 当 训练 样本 集 远 远 小 于 测试 样 
本 集 ， 即 便 SVM 具 有 较 强 的 泛 化 性 ， 也 难以 给 出 令 人 满意 的 结果 。 


8$1.2 研究 意义 


本 研究 充分 考虑 遥感 影像 特点 及 SVM 土 地 覆盖 分 类 技术 不 足 的 
问题 ， 一 方面 利用 智能 优化 算法 ， 克 服 传统 SVM 参 数 选择 不 准确 次 
端 ， 另 一 方面 ， 将 模糊 聚 类 技术 、 半 监督 学 习 和 集成 学 习 理论 引入 
SVM 土地 覆盖 分 类 方法 中 ， 有 效 地 解决 小 样本 问题 。 其 目的 在 于 丰 
富 土地 覆盖 遥感 信息 提取 理论 与 方法 ， 提 高 土地 覆盖 分 类 精度 ， 为 
土地 资源 的 合理 保护 、 利 用 与 监测 提供 更 为 有 效 的 数据 信息 。 
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121 ”丰富 土地 覆盖 遥感 分 类 的 理论 与 方法 


综合 现 有 的 遥感 影像 分 类 研究 工作 ， 许 多 学 者 都 默认 所 选择 的 
样本 对 影像 中 地 物 类 别 具 有 较 好 的 代表 性 ， 而 将 分 类 结果 不 理想 归 
咎 于 分 类 算法 的 不 适用 。 然 而 ， 在 实际 应 用 中 ， 样 本 的 选取 不 可 和 避 
免 地 会 存在 易 出 错 和 经 验 知识 有 限 等 缺点 ， 很 难保 证 获得 的 训练 样 
本 能 对 分 类 类 别 有 很 好 的 代表 性 。 针 对 遥感 影像 分 类 中 人 为 选择 样 
本 代表 性 不 好 且 样 本 数量 不 足 等 问题 ， 本 书 提出 将 半 监 督学 习 、 模 
糊 聚 类 、 集 成 学 习 与 SVM 分 类 方法 相 结合 ， 减 少 了 分 类 对 准确 先 验 
知识 或 充足 的 训练 样本 的 依赖 程度 ， 节 省 了 大 量 样本 获取 所 需 的 人 
力 、 物 力 和 财力 。 

参数 选择 是 任何 机 器 学 习 方法 都 必须 面 对 的 重要 而 困难 的 
问题 。 选 择 适 合 的 SVM 核 函数 及 其 设置 准确 参数 对 提高 遥感 影像 
分 类 精度 非常 重要 。 本 选 题 所 研究 的 利用 智能 优化 算法 对 SVM 的 
参数 优化 极 大 地 改善 了 传统 SVM 分 类 的 泛 化 能 力 。 


1.2.2 为 土地 利用 /覆盖 的 动态 监测 、 保 护 和 管理 
提供 技术 支持 


通过 有 效 的 遥感 分 类 方法 准确 提取 土地 覆盖 信息 ， 掌 握 土 地 利 
用 /覆盖 变化 程度 、 类 型 和 分 布 ， 为 因 土地 覆盖 变化 而 造成 的 土地 退 
化 、 荒 漠 化 ， 甚 至 全 球 变 暖 、 酸 雨 等 环境 问题 的 预防 和 治理 提供 参 
考 数据 和 科学 依据 ， 此 研究 具有 重要 的 理论 意义 与 实际 应 用 价值 。 
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1.2.3 ”一 种 新 的 自 适 应 半 监 督 支持 向 量 机 遥感 分 类 
模型 的 提出 


著作 提出 一 种 新 的 半 监 督 支持 向 量 机 分 类 模型 ， 在 自 训 练 半 监 
督 算法 的 基础 上 ， 利 用 自 适应 变异 粒子 群 算法 对 SVM 参数 优化 ， 提 
高 单个 分 类 器 的 分 类 精度 ; 在 Self-training 标 注 未 标记 样本 阶段 ， 采 
用 Gustafson-Kessel 模 糊 聚 类 算法 将 最 接近 样本 的 有 效 无 标签 样本 作 
为 标注 对 象 ， 以 控制 错误 信息 的 输入 ， 实 验 结果 表明 其 土地 覆盖 分 
类 效果 较 好 。 


1.24 ， 半 监督 学 习 思想 和 集成 学 习 思 想 的 融合 

多 年 以 来 ， 半 监督 学 习 与 集成 学 习 的 发 展 几乎 是 并 行 的， 只 有 
少数 研究 涉及 二 者 的 融合 。 本 书 充分 分 析 集成 学 习 与 半 监 督学 习 之 
间 的 关系 ， 提 出 将 半 监 督 分 类 器 集成 ， 构 建 半 监督 集成 土地 覆盖 分 
类 模型 ， 进 一 步 改进 学 习 系 统 的 泛 化 能 力 。 


8813 本 书 研 究 方法 及 结构 安排 


1.3.1 研究 方法 


1. 构建 遥感 影像 数字 集 
本 书 以 图 们 江 下 游 ， 中 、 朝 、 俄 交界 处 作为 研究 对 象 ， 选 取 
行列 号 115-30 遥 感 影像 ， 包 括 近 20 年 的 6 幅 不 同时 相 的 Landsat TM/ 
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ETM+ 影 像 ， 依 据 联 合 国 粮农 组 织 提 出 的 土地 覆盖 分 类 体系 和 中 国 
科学 院 资源 环境 数据 库 土地 利用 分 类 体系 ， 从 遥感 制图 角度 和 区 域 
地 理 环境 特点 出 发 ， 建 立 了 研究 区 土地 覆盖 遥感 分 类 体系 ,利用 简 
单 随机 采样 方法 进行 样本 提取 ， 采 用 主 成 分 分 析 (PCA)、NDVI 植 被 
指数 等 方法 获取 影像 分 类 特征 集合 ， 如 图 1-1(a) 部 分 所 示 。 

2. SVM 算 法 

SVM 以 统计 学 习 VC 维 理论 和 结构 风险 最 小 化 原理 为 原则 ， 根 
据 有 限 样本 信息 在 模型 的 复杂 性 ( 即 对 特定 训练 样本 的 学 习 精 度 ) 和 
期 望 风 险 ( 即 无 错误 地 识别 任意 样本 的 能 力 ) 之 间 寻 求 最 佳 折 中 ， 以 
获得 更 好 的 泛 化 性 能 。 与 传统 遥感 分 类 方法 相 比 ，SVM 技 术 具 有 维 
数 不 敏 感 、 泛 化 能 力 强 等 优点 ， 适 合 处 理 高 维 、 小 样本 等 问题 ， 因 
而 ， 成 为 近 几 年 遥感 分 类 领域 中 的 一 个 非常 活跃 的 研究 热点 ， 如 图 
1-1(b) 部 分 所 示 。 

3. 自 适应 变异 粒子 群 算法 

自 适 应 变异 粒子 群 算法 (Adaptive Mutation Particle Swarm 
Optimization，AMPSO) 在 运行 过 程 中 根据 群体 适应 度 方 差 以 及 当 
前 最 优 解 的 大 小 来 确定 当前 最 佳 粒子 的 变异 概率 ， 当 算法 陷入 局 部 
极 值 时 ， 根 据 变异 算 子 使 得 算法 能 够 及 时 跳出 局 部 极 值 进而 获得 
全 局 最 优 解 。 其 目的 是 快速 摆脱 局 部 搜索 的 束缚 ， 提 高 全 局 搜索 
的 性 能 ， 进 而 克服 早熟 收敛 造成 分 类 参数 寻找 不 准确 的 缺点 ， 如 图 
1-1(b) 部 分 所 示 。 

4. Gustafson-kesse] 聚 类 算法 

模糊 性 是 遥感 图 像 所 固有 的 特性 ， 由 于 不 确定 性 和 混合 像 元 的 
存在 ， 多 光谱 遥感 图 像 散 点 图 在 特征 空间 中 是 趋 于 椭 球 体 分 布 的 ， 
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而 基于 欧式 距离 的 Fuzzy c-means 算 法 更 适合 于 对 球体 分 布 的 数据 进 
行 聚 类 分 析 。Gustafson-Kessel(GKclusb 是 距离 自 适应 动态 聚 类 算法 
(Adaptive Distance Dynamic Clustering Algorithm) 的 模糊 推广 ， 可 以 
有 效 地 搜索 超 椭 球 、 平 面 或 线 型 的 数据 类 ， 在 遥感 数据 聚 类 表现 效 
果 更 优 ， 如 图 1-1(c) 部 分 所 示 。 

5. 自 训 练 半 监督 学 习 算 法 

自 训 练 (Self-training) 是 半 监 督学 习 比 较 简 单 且 常 用 的 方法 。 自 
训练 方法 首先 用 有 标签 样本 训练 一 个 弱 分 类 器 ， 然 后 用 此 弱 分 类 器 
对 所 有 无 标签 样本 标注 置信 度 ， 将 最 可 信 的 无 标签 样本 加 入 到 原始 
标签 样本 集合 ， 以 扩大 可 用 标签 样本 集 的 数量 。 本 书 以 该 算法 结合 
Gkclust 模 糊 聚 类 算法 ， 将 有 标签 和 无 标签 的 样本 有 效 地 结合 起 来 ， 
期 望 训练 出 一 个 效果 更 好 的 分 类 器 ， 如 图 1-1(c) 部 分 所 示 。 

6. 分 类 器 集成 学 习 算 法 

集成 学 习 首 先 训练 多 个 有 差异 的 学 习 器 ， 然 后 对 多 个 分 类 器 
的 分 类 结果 进行 组 合 来 决定 最 终 的 分 类 。 相 对 于 单个 学 习 器 ， 集 成 
学 习 算 法 可 以 显著 地 提高 学 习 系 统 的 泛 化 能 力 。 本 书 在 研究 半 监 督 
SVM 分 类 器 的 同时 ， 产 生 了 若干 个 性 能 差异 的 半 监 督 分 类 器 个 体 ， 
通过 加 权 投 票 策略 将 这 些 半 监督 分 类 器 个 体 有 效 地 结合 起 来 ， 期 户 
可 以 进一步 改善 单个 分 类 器 的 不 足 ， 更 快 地 达到 理想 的 分 类 精度 ， 
如 图 1-1(d) 部 分 所 示 。 

方法 流程 图 如 图 1-1 所 示 。 
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1.3.2 ”结构 安排 


Wim ”绪论 
本 章 介绍 机 器 学 习 、 遥 感 分 类 、 土 地 覆盖 相关 概念 ， 目 前 机 器 分 
类 在 遥感 应 用 领域 存在 的 问题 及 研究 意义 ; 本 研究 的 研究 方法 及 主要 
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内 容 及 创新 点 。 

第 2 章 关键 技术 国内 外 研究 现状 

本 章 介绍 SVM 遥 感 分 类 研究 进展 ， 半 监督 学 习 、 集 成 学 习 研究 
现状 ; 目前 遥感 影像 信息 提取 技术 存在 问题 。 

第 3 章 ”遥感 图 像 数字 化 

本 章 确定 研究 区 域 ， 以 行列 号 115-30 一 景 、 近 20 年 的 6 幅 不 同时 
相 的 Landsat ETM/TM 影 像 作为 研究 材料 。 讨 论 本 书 所 采用 的 影像 合 
成 方式 、 特 征 采集 方法 、 土 地 覆盖 分 类 依据 ， 以 及 特征 选取 方法 ， 
为 进一步 研究 分 类 方法 提供 必要 的 数据 材料 。 

第 4 章 SVM 参数 优化 方法 研究 

本 章 针对 传统 PSO 优 化 SVM 参 数 存 在 早熟 收敛 、 后 期 迭代 效 
率 不 高 从 而 造成 参数 寻 优 不 准确 缺点 ， 提 出 了 一 种 基于 自 适应 变异 
粒子 群 算法 的 SVM 参数 优化 模型 (AMPSO-SVM)。 并 将 所 提 方 法 与 
SVM 和 传统 PSO 优 化 SVM 方法 进行 比较 。 

第 5 章 ”基于 模糊 聚 类 的 半 监 督 支持 向 量 机 土地 覆盖 分 类 方法 研究 

本 章 一 方面 利用 自 训 练 半 监 督 算法 ， 在 较 少 训练 标签 样本 的 基 
础 上 ， 同 时 利用 大 量 、 廉 价 的 未 标记 样本 ， 目 的 在 于 挖掘 未 标记 样 
本 中 所 蕴涵 固有 结构 信息 ， 来 对 分 类 器 偏差 情况 进行 娇 正 ， 此 外 ， 
为 了 避免 自 训练 算法 的 “错误 累积 ”现象 ， 将 以 SVM 作 为 基 分 类 
器 ， 并 将 所 提出 的 改进 智能 优化 算法 为 SVM 参数 选择 的 依据 。 另 一 
方面 ， 由 于 遥感 图 像 存 在 同 物 异 谱 、 同 谱 异 物 、 混 合 像 元 等 特点 ， 
将 模糊 聚 类 算法 引入 到 未 标签 样本 标记 过 程 中 。 

第 6 章 ”基于 半 监 督 集成 支持 向 量 机 的 土地 覆盖 分 类 研究 

本 章 从 个 体 生 成 (使 用 程序 来 生成 个 体 分 类 器 ) 和 结论 生成 (选择 
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特定 的 策略 来 组 合 分 类 器 ) 两 个 部 分 考虑 ， 提 出 半 监 督 集成 SVM 分 
类 策略 。 该 策略 分 两 个 步骤 : 首先 ， 个 体 生 成 部 分 一 方面 利用 改进 
智能 算法 优化 SVM 分 类 器 参数 以 获得 高 精度 分 类 器 个 体 ， 另 一 方面 
采用 Gustafson-Kessel] 聚 类 算法 控制 自 训练 算法 错误 标记 样本 的 加 入 
以 提高 个 体 分 类 器 的 差异 性 ; 然后 ， 结 论 生成 部 分 采用 加 权 投 票 策 
略 将 半 监 督 分 类 器 个 体 集 成 ， 最 后 将 该 模型 应 用 于 土地 履 盖 遥感 分 
类 实验 。 

第 7 章 “总结 与 展望 

本 章 对 专著 主要 研究 内 容 进行 总 结 ， 深 入 分 析 遥 感 分 类 领域 的 
研究 方法 现状 及 不 足 ， 探 讨 新 的 土地 覆 六 遥感 分 类 方法 。 同 时 ， 陈 
述 本 书 研究 的 不 足 及 对 未 来 研究 进行 展望 。 
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涯 2.1 遥感 影像 信息 提取 方法 


遥感 分 类 是 获取 遥感 影像 信息 的 一 个 重要 环节 ， 早 在 20 世 纪 50 
年 代 ， 人 们 就 开始 探讨 利用 遥感 资料 进行 大 范围 制图 的 可 行 性 ， 并 
发 展 了 适用 于 遥感 数据 特点 的 相关 研究 地 物 分 类 系统 及 其 分 类 方 
法 外。 其 中 ， 传 统 分 类 方法 是 基于 地 形 图 、 调 查 数据 以 及 一 些 航 空 
图 片 的 方法 对 地 物 变 化 进行 地 面 测 量 。 然 而 这 种 方法 不 仅 速度 慢 ， 
而 且 周 期 长 ， 不 能 达到 时 时 、 动 态 监 测 的 需要 。 近 几 十 年 来 ， 随 着 
传感器 技术 的 发 展 ， 遥 感 影像 波谱 分 辨 率 、 空 间 分 辩 率 不 断 提高 ， 
同时 计算 机 技术 、 地 理 信 息 系统 等 相关 理论 技术 不 断 进步 ， 许 多 学 
者 对 遥感 影像 的 自动 分 类 算法 进行 了 大 量 有 益 的 研究 ， 包 括 监督 分 
类 学 习 方法 ， 如 基于 统计 分 析 分 类 方法 (最 大 似 然 法 ， 朴 素 贝 叶 斯 分 
类 )、 决 策 树 分 类 方法 、 神 经 网 络 分 类 方法 ， 非 监督 分 类 学 习 方 法 ， 
如 K-means 算 法 、 模 糊 C-means 算 法 、AP 聚 类 算法 等 。 

基于 传统 统计 分 析 法 的 土地 覆盖 分 类 是 目前 较为 成 熟 、 应 用 较 
多 的 算法 ， 如 最 大 似 然 分 类 法 (Maximum Likelihood Classification, 
MLC)。MLC 假 设 同一 类 别 的 训练 集中 各 点 的 整体 分 布 属 于 正 态 分 
布 ， 利 用 训练 集 可 求 出 方差 、 协 方差 以 及 均值 等 特征 参数 ， 从 而 求 
出 总 体 的 先 验 概率 密度 函数 。 骆 剑 承 等 中 提出 基于 有 限 混合 密度 理 
论 的 期 望 最 大 (EM) 算 法 来 作为 最 大 似 然 函数 (MLC) 参 数 估计 的 方法 
构建 EM2MLC 模 型 ， 应 用 于 土地 覆盖 分 类 ， 并 将 分 类 结果 进行 了 
定性 和 定量 的 综合 比较 ， 认 为 EM2MLC 在 精度 上 得 到 了 提高 。 李 
全 等 外 分 析 土 地 覆盖 分 类 应 用 中 最 大 似 然 分 类 算法 的 不 足 ， 包 括 确 
定 分 类 类 别 及 数量 、 光 谱 波 段 、 先 验 概率 、 选 择 和 改进 样本 区 ， 
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以 南京 市 TM 数 据 为 例 进行 了 土地 覆盖 分 类 实验 ， 结 果 证 明 此 方法 
能 有 效 提 高 分 类 精度 。 最 大 似 然 分 类 法 的 扩展 就 是 贝 叶 斯 分 类 法 
(Bayesian Classification)， 这 种 方法 在 概率 估计 时 增加 了 加 权 因 子 进 
行 判断 ， 由 于 它 具 有 综合 先 验 信息 和 数据 样本 信息 的 能 力 ， 而 且 简 
单 有 效 ， 所 以 得 到 了 广泛 的 应 用 四。 最 大 似 然 分 类 法 的 主要 缺点 是 ， 
在 对 每 一 个 像 元 分 类 时 需要 进行 大 量 的 计算 来 判断 众多 的 光谱 通道 和 
鉴别 多 种 光谱 类 型 ， 此 外 ， 基 于 统计 学 分 类 器 以 变量 之 间 “ 独 立 性 假 
设 ” 为 前 提 ， 而 在 现实 世界 中 ， 这 种 假设 往往 很 难 被 满足 。 

决策 树 方法 是 多 元 统计 分 类 的 一 种 方法 。 决 策 树 算法 用 于 遥感 
分 类 的 优势 在 于 对 数字 影像 数据 特征 空间 的 分 割 ， 主 要 表现 为 分 类 
结构 简单 明了 ， 对 数据 特征 空间 分 布 不 需要 预先 假设 某 种 参数 化 密 
度 分 布 。 并 且 它 属于 严格 “ 非 参 ” 分 类 方法 ， 对 于 输入 数据 空间 特 
征 和 分 类 标识 具有 更 好 的 弹性 和 稳健 性 。 

Pal 和 MatherD 提 出 利用 决策 树 方法 对 不 同 的 研究 区 域 以 及 不 同 
传感器 所 获得 的 影像 进行 土地 覆盖 分 类 ， 充 分 研究 训练 集 尺 寸 、 特 
征 维 数 ， 以 及 特征 选择 对 分 类 器 分 类 精度 的 影响 。 

潘 琛 等 0 结合 遥感 图 像 分 类 的 特点 ， 探 讨 了 决策 树 分 类 的 实现 
方法 和 关键 问题 ， 以 徐州 市 TM 影像 作为 数据 源 进行 了 分 类 试验 。 
试验 说 明了 决策 树 分 类 法 在 遥感 图 像 处 理 中 的 具体 实现 过 程 ， 并 且 试 
验 结果 表明 该 方法 在 依据 感 兴趣 区 类 别 进行 图 像 分 类 时 效果 较 好 。 

那 晓 东 等 中 利用 TM 卫星 影像 数据 ， 基 于 半 方 差分 析 和 Z 检 验方 
法 交 选 最 优 的 窗口 大 小 、 纹 理 特征 及 其 派生 波段 ， 采 用 快速 、 无 
偏 、 高 效 统计 树 算法 集成 遥感 影像 的 光谱 特征 、 多 尺度 纹理 特征 和 
地 学 辅助 数据 ， 建 立 研究 区 湿地 信息 提取 的 决策 树 模型 。 结 果 表 明 
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分 类 精度 较 好 ， 是 内 陆 淡水 沼泽 湿地 信息 提取 的 有 效 手段 。 决 策 树 
算法 的 不 足 在 于 它 需 要 大 量 的 训练 样本 来 探究 各 类 别 属 性 间 的 关 
系 ， 而 且 算法 基础 比较 复杂 ， 当 空间 数据 特征 比较 简单 且 样本 量 不 
足 时 ， 分 类 结果 表现 较 差 。 

神经 网 络 属于 非 参数 分 类 器 ， 该 方法 被 用 于 于 感 分 类 ， 始 于 
1988 年 。 与 传统 统计 分 析 方法 相 比 ， 神 经 网 络 分 类 方法 不 需要 预定 
义 分 类 中 各 个 数据 源 的 先 验 权 值 ， 也 不 需要 任何 关于 统计 分 布 的 先 验 
知识 。 因 此 ， 它 用 于 遥感 影像 分 类 时 不 必 考虑 像 元 统计 分 布 特征 。 

Kavzoglu 和 Mather 四 提出 使 用 两 个 数据 集 优 化 的 神经 网 络 参 
数 ， 将 其 分 类 模型 用 于 土地 覆盖 分 类 实验 ， 取 得 很 好 的 分 类 效果 。 

熊 桢 等 将 人 工 神经 网 络 技术 和 分 层 处 理 技术 结合 ， 设 计 了 一 
种 分 层 神经 网 络 分 类 算法 ， 并 将 其 用 于 土地 覆盖 分 类 。 实 验 表 明 这 
种 分 层 神 经 网 络 分 类 算法 可 以 明显 地 提高 分 类 精度 ， 并 对 不 规则 分 
布 的 复杂 数据 具有 很 强 的 处 理 能 力 。 

王 任 华 等 ("应 用 人 工 神经 网 络 模 型 对 陆地 卫星 TM 多 光谱 图 像 
进行 了 森林 植被 分 类 的 研究 ， 所 采用 的 网 络 模型 为 3 层 误差 后 向 传 
播 神经 网 络 模型 ， 实 验 还 引入 高 程 数据 作为 一 个 独立 波段 与 3 个 多 
光谱 波段 一 起 进行 分 类 ， 效 果 明 显 ， 对 存在 同 物 异 谱 现 象 的 阔 叶 林 
分 类 精度 也 有 一 定 程度 的 提高 。 尽 管 如 此 ， 神 经 网 络 也 存在 着 局 部 
最 小 化 、 结 构 参 数 选取 困难 以 及 过 学 习 等 问题 ， 在 具体 应 用 过 程 中 
不 得 不 耗费 大 量 时 间 进 行 参数 选择 、 样 本 预 处 理 等 工作 。 

上 述 分 类 方法 均 基 于 监督 分 类 ， 又 称 为 训练 区 分 类 ， 它 对 充 
足 且 准 确 的 训练 样本 数量 有 很 强 的 依赖 性 。 非 监督 聚 类 ， 作 为 遥感 
DRONA MATE, Die RHEE MARA, MERA Rhy 
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的 光谱 特征 分 布 规律 自然 地 进行 分 类 ， 最 后 通过 对 各 类 光谱 响应 
曲线 的 进一步 分 析 得 出 类 别 属性 。 其 中 ，K-means 算 法 因 其 收敛 速 
度 快 、 算 法 结构 简单 已 成 为 遥感 分 类 的 常用 聚 类 算法 之 一 "0， 但 是 
K-means 属 于 硬 聚 类 算法 ， 每 个 待 分 像 元 必须 严格 划分 到 各 个 类 别 
中 ， 而 和 遥感 影像 的 随机 性 及 不 确定 性 使 得 混合 像 元 问题 难以 进行 非 
此 即 彼 的 划分 ， 此 外 ，K-means 算 法 容易 陷入 局 部 极 小 值 ， 对 异常 
值 敏感 。 针 对 这 些 问 题 ， 许 多 学 者 提出 利用 模糊 集 理 论 为 地 物 进行 
软 划分 来 解决 遥感 数据 混合 像 元 的 分 类 ， 尤 淑 撑 等 叫 将 模糊 分 类 技 
术 用 于 多 时 相 的 Scan SAR 的 作物 识别 ， 认 为 其 与 传统 的 最 大 似 然 分 
类 法 相 比 ， 具 有 较 高 的 识别 精度 Wang 和 Mo 将 模糊 集 理 论 应 用 
FIERA BAK; Thitimajshimal Fuzzy c-means 聚 类 算法 应 用 于 
多 光谱 图 像 分 割 取得 很 好 的 结果 。 

除了 K-means 和 Fuzzy c-means 算 法 ，Yangb3 提 出 将 快速 高 效 吸 
引子 传播 算法 (Affinity Propagation，AP) 与 模糊 统计 学 相似 性 度量 的 
概念 结合 ， 提 出 了 基于 模糊 统计 学 的 吸引 子 传播 算法 (Fuzzy Statistics- 
Based Affinity Propagation，FS-AP)， 并 将 其 应 用 到 多 光谱 遥感 图 像 分 
类 中 ， 提 高 了 分 类 的 精度 和 效率 。 

以 上 研究 表明 ， 在 遥感 影像 分 类 领域 ， 各 类 算法 各 具 特 点 ， 新 
的 分 类 技术 相 比 于 传统 方法 在 分 类 精度 上 有 了 一 些 提高 ， 但 也 存在 
一 定 的 不 足 。 因 此 ， 继 续 探 索 先进 方法 以 提高 遥感 影像 的 分 类 精度 
仍然 存在 广阔 的 研究 空间 。 
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8$2.0 SVM 玩 感 分 类 研究 进展 


SVM 是 一 种 基于 统计 学 习 理论 的 新 型 监督 学 习 算 法 ， 通 过 对 偶 
优化 形式 在 高 维特 征 空间 中 寻找 最 优 分 类 超 平面 ， 从 而 解决 复杂 数 
据 的 分 类 及 回归 问题 。SVM 算 法 具有 结构 简单 ， 泛 化 能 力 强 ， 易 解 
决 具有 高 维特 征 、 小 样本 与 不 确定 性 等 问题 的 优势 "9， 能 够 有 效 克 
服 统计 方法 所 要 求 特 征 向 量 服 从 正 态 分 布 的 要 求 ， 同 时 也 解决 了 神 
经 网 络 方法 中 无 法 避免 的 局 部 极 值 问题 ， 非 常 适合 高 维 、 复 杂 的 小 
样本 多 维 数据 分 类 。 


2.2.1 SVM 在 遥感 分 类 中 的 优点 


1. SVM 是 一 种 稳定 的 分 类 器 ， 具 有 较 好 的 泛 化 能 力 

SVM 理论 适合 有 限 样本 分 类 ， 即 其 目标 是 得 到 现 有 信息 下 的 最 
优 解 而 不 仅仅 是 样本 数 趋 于 无 穷 大 时 的 最 优 解 。 

Foody 和 Mathur "利用 SVM 进行 遥感 影像 分 类 ， 仅 仅 使 用 SPOT 
HRV 卫 星 影 像 的 四 分 之 一 作为 原始 训练 样本 就 可 以 得 到 很 高 的 分 类 
精度 。 

Sahoo 等 5 使 用 SVM 算法 进行 地 质 分 类 的 实验 ， 实 验 结果 表 
明 ，SVM 适 用 于 小 样本 数据 分 类 ， 并 且 表现 出 很 强 的 鲁 棒 性 。 

Mathur and Foody 吧 提出 Crop Land Mapping Equivalent 方 法 能 有 
效 降低 样本 数量 。 

Muiioz-Mari 等 的 用 单 类 分 类 器 对 单 类 和 多 类 遥感 问题 分 类 并 进 
行 比较 ， 结 论 指 出 ， 作 为 支持 向 量 域 描述 (SVDD) 的 单 类 分 类 器 ， 在 
处 理 不 完整 数据 集 时 ， 表 现 得 尤为 出 色 。 
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2. SVM 在 处 理 高 维 的 高 光谱 遥感 数据 表现 性 能 更 优 

高 光谱 遥感 图 像 能 够 提供 几乎 连续 的 地 物 波 谱 曲 线 ， 使 得 高 光 
谱 数 据 具有 维 数 高 、 数 据 量 大 、 数 据 不 确定 性 等 特点 。SVM 算 法 通 
过 核 函数 将 非 线性 变换 映射 到 高 维 的 特征 空间 (Feaurte Space)， 在 高 
维 空间 中 构造 线性 判别 函数 来 实现 原 空间 中 的 非 线 性 判别 函数 ， 巧 
妙 地 解决 了 维 数 问 题 。 

Melgani 和 BruzzoneP 将 SVM 应 用 于 高 光谱 遥感 图 像 分 类 ， 并 与 K- 
近邻 分 类 器 和 RBF 神经 网 络 进行 对 比 ， 从 精度 、 稳 定性 、 计 算 速 度 及 计算 
复杂 性 方面 进行 论证 ， 说 明了 SVM 应 用 于 高 光谱 图 像 分 类 的 有 效 性 。 

谭 琨 和 杜 培 军 馈 从 SVM 基本 理论 出 发 建立 了 一 个 基于 SVM 的 高 
光谱 分 类 器 ， 分 析 比 较 了 各 种 SVM 核 函数 对 高 光谱 遥感 图 像 分 类 精 
度 的 影响 ， 利 用 网 格 搜寻 的 方法 来 确定 SVM 参数 值 ， 结 果 表 明 SVM 
进行 高 光谱 分 类 的 时 候 径 向 基 核 函数 是 分 类 的 首选 。 

Chen 等 中 提出 了 一 个 由 多 层次 堆 又 的 SVM 改 进 分 类 模型 ， 该 
方法 还 包含 有 效 区 分 两 个 特征 空间 的 信息 (如 大 小 和 形状 )。 实 验 表 
明 ， 模 型 具有 很 强 的 泛 化 能 力 ， 同 时 多 特征 空间 的 利用 对 高 光谱 图 
像 分 类 精度 的 提高 也 是 有 效 的 。 

3. SVM 可 以 获得 全 局 最 优 解 ， 避 免 局 部 极 值 问题 

SVM 算法 将 训练 问题 转化 为 一 个 求解 受 约束 的 二 次 型 规划 问 
题 ， 从 理论 上 讲 得 到 的 将 是 全 局 最 优点 ， 由 此 可 以 避免 神经 网 络 训 
练 结果 不 稳定 、 容 易 陷入 局 部 极 小 的 问题 外。 此 外 ，SVM 易 处 理 高 
维 数据 的 优势 ， 也 使 得 多 源 遥 感 数据 所 组 成 的 高 维特 征 空间 分 类 不 
会 出 现 传统 统计 分 类 方法 所 不 可 避免 的 过 学 习 问题 5 。 

Huang 等 将 SVM 应 用 于 多 光谱 遥感 土地 利用 分 类 ， 并 与 最 大 
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似 然 法 、 人 工 神经 网 络 和 决策 树 方法 进行 对 比 ， 论 证 了 SVM 在 精 
度 与 稳定 性 方面 都 优 于 以 上 方法 。 

骆 剑 承 等 "以 SPOT 全 色 波 段 影像 上 城市 特征 信息 的 提取 为 应 
用 实例 ， 并 与 人 工 神经 网 络 等 特征 提取 方法 进行 综合 比较 ， 认 为 
SVM 方 法 不 但 能 够 获得 比较 高 的 分 类 精度 ， 而 且 在 自 适应 能 力 、 
学 习 速 度 、 特 征 空间 高 维 不 限制 、 可 表达 性 等 方面 具有 优势 。 


222 SVM 在 遥感 影像 分 类 中 的 不 足 


虽然 SVM 在 遥感 图 像 分 类 中 取得 了 很 好 的 效果 ， 但 仍 存在 有 待 
改进 和 完善 之 处 ， 至 少 在 以 下 几 个 问题 方面 还 需要 进行 深入 研究 。 

1. 核 函 数 和 分 类 参数 (包括 惩罚 系数 c、 核 函数 参数 ) 的 选择 没有 
特别 好 的 办 法 ， 应 用 时 不 容易 找到 最 优 的 核 函 数 和 分 类 参数 

核 函数 的 选择 在 SVM 分 类 处 理 中 发 挥 着 重要 作用 ，MERCER 
准则 是 构造 核 函 数 应 该 满足 的 条 件 ， 通 常 包括 全 局 核 和 局 部 核 ， 
前 者 如 线性 核 、 多 项 式 核 和 Sigmoid 核 函数 等 ， 后 者 如 径 向 基 核 、 
KMOD 核 函数 等 。 如 何 针对 特定 问题 选择 核 函数 ， 目 前 并 无 准确 原 
则 ， 是 一 个 比较 困难 的 问题 。 此 外 ， 设 置 合适 的 SVM 核 函数 参数 对 
提高 遥感 影像 分 类 精度 也 是 非常 重要 的 。SVM 的 参数 主要 指 的 是 惩 
罚 参 数 c 和 核 函数 参数 。 惩 罚 系数 c 是 一 个 重要 的 量 ， 控 制 对 错 分 样本 
的 惩罚 程度 。 核 函数 的 参数 通常 影响 决策 面 的 复杂 性 。 如 果 不 适当 地 
选取 这 两 个 参数 ， 可 能 产生 “过 学 习 ” 或 “从 学 习 ” 的 问题 四。 

2. 遥感 数据 的 模糊 性 、 不 确定 性 是 影响 SVM 分 类 精度 的 原因 
之 一 

和 遥感 数据 的 模糊 性 和 不 确定 性 表现 在 ， 遥 感 图 像 自身 的 像素 值 
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是 不 准确 的 ;遥感 映射 机 制 可 能 造成 的 歧义 性 ;遥感 图 像 地 物 的 边 
RAB, Ault, BARR MRIS. MERY, RAR 
元 等 问题 ， 在 分 类 过 程 中 对 混合 像 元 很 难 进行 非 此 即 彼 的 划分 ， 这 
些 很 容易 造成 SVM 分 类 器 的 错 分 、 漏 分 现象 ， 最 终 导 致 分 类 器 精度 
低下 。 

3. SVM 分 类 器 依赖 于 充足 且 代表 性 好 的 样本 

准确 先 验 知识 或 充足 的 训练 样本 是 保证 监督 分 类 器 分 类 精度 的 
重要 条 件 。 它 们 的 获取 一 方面 消耗 大 量 的 人 力 和 财力 ， 另 一 方面 人 
为 选择 样本 时 对 待 分 类 影像 认 知 的 有 限 性 以 及 选择 时 的 盲目 性 等 因 
素 ， 均 会 导致 得 到 的 样本 数量 少 且 代表 性 不 好 中 ?的 。 当 训练 样本 集 
数量 远 远 小 于 测试 样本 集 ， 即 便 SVM 善 于 处 理 小 样本 问题 ， 也 难以 
保证 取得 理想 的 分 类 效果 。 


22.3 SVM 在 遥感 影像 分 类 中 的 应 用 领域 


近年 来 ， 国 内 外 许多 学 者 将 SVM 应 用 于 遥感 影像 的 处 理 与 分 类 
中 PP。 具体 应 用 领域 包括 以 下 几 个 方面 。 

1. 土地 覆盖 分 类 

PalE0 提 出 非 穷尽 搜索 与 遗传 算法 (Genetic Algorithms，GA) 结 合 
SVM 的 分 类 方法 ， 并 将 其 应 用 于 土地 覆盖 分 类 任务 。 

Carrão 等 中 利用 SVM 分 类 方法 对 多 光谱 MODIS 遥 感 数 据 进行 处 
理 ， 解 决 土地 利用 分 类 问题 。 

张 锦 水 等 所 基于 变化 向 量 分 析 方法 ， 将 光谱 与 纹理 两 种 信息 复 
合计 算 变化 强度 ， 并 采用 SVM 法 提取 变化 / 非 变 化 信息 ， 通 过 监督 
分 类 确定 变化 区 域内 的 土地 利用 /覆盖 类 型 的 转移 方向 ， 完 成 土地 利 
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用 /覆盖 动态 监测 。 

2. 作物 生长 监测 

Tan 等 的 利用 焙 分 解 和 SVM 相 融 合 的 分 类 技术 对 多 时 相 SAR 图 
像 分 类 ， 以 实现 水 稻 监 测 。 

顾 幸 生 等 的 在 标准 最 小 二 乘 SVM 的 基础 上 ， 利 用 改进 的 粒子 群 
算法 优化 SVM 模型 参数 ， 提 出 了 基于 IPSO-LS-SVM 的 软 测量 建 模 方 
法 ， 建 立 了 作物 叶 水 势 软 测量 模型 。 

3. 森林 植被 分 类 

张 友 静 等 83 利用 高 分 辨 率 卫星 影像 区 ONOS， 以 实验 区 与 验证 
区 城市 植被 类 型 信息 为 对 象 ， 基 于 常用 的 参数 和 非 参 数 分 类 方法 的 
对 比 ， 分 析 SVM 的 核 函数 及 其 参数 对 分 类 精度 的 影响 程度 ， 构 建 了 
SVM 决策 树 的 城市 植被 类 型 分 类 模型 。 

Dalponte 等 9 利用 SVM 进 行 森林 类 型 识别 ， 取 得 很 好 的 效果 。 

4. 城市 增长 变化 监测 

Nemmour and Chibani 3 研究 利用 Landsat 影 像 进 行 城市 变化 监 
测 ， 试 验 表 明 SVM 方 法 优 于 神经 网 络 方法 。 

Licciardi 等 中 利用 5 种 算法 对 高 光谱 影像 数据 分 类 以 实现 城市 区 
域 变 化 监测 ， 结 果 表 明 SVM 分 类 方法 性 能 最 优 。 

沈 体 雁 等 的 以 我 国 京 津 唐 都 市 圈 为 试验 区 ， 采 用 MODIS 遥 感 影 
像 作 为 主要 数据 源 ， 基 于 SVM 分 类 技术 ， 探 讨 实现 一 种 新 的 城市 空 
间 增 长 和 城市 土地 利用 变化 遥感 信息 提取 方法 。 
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5$23 半 监 督学 习 理论 及 研究 进展 


监督 学 习 指 学 习 机 通过 对 大 量 有 标签 的 训练 样本 进行 学 习 ， 从 
而 推导 出 一 个 预测 模型 ， 判 断 未 知 样本 点 的 标签 。 无 监督 学 习 是 在 
完全 没有 标签 的 样本 集中 学 习 ， 推 导出 样本 数据 集 的 结构 。 半 监督 
学 习 方法 介 于 二 者 之 间 ， 在 利用 有 标签 样本 学 习 的 同时 ， 挖 掘 未 标 
记 样本 中 所 蕴涵 的 大 量 可 用 信息 ， 利 用 一 些 分 布 上 的 假设 或 者 样本 
之 间 的 内 在 联系 ， 将 未 标签 样本 转化 为 有 标签 样本 ， 然 后 合并 到 有 
标签 的 数据 中 ， 扩 大 可 用 的 训练 数据 集 ， 从 而 使 分 类 器 的 性 能 更 优 
异 。 在 遥感 信息 提取 中 ， 通 过 少量 的 标记 样本 学 习 来 完成 大 量 未 标 
记 样本 的 自动 分 类 ， 对 于 遥感 图 像 处 理 具 有 重要 的 研究 意义 。 

半 监 督学 习 是 近年 来 随 着 统计 学 习 技术 的 不 断 发 展 ， 以 及 
利用 无 标签 样本 这 一 需求 越 来 越 强烈 而 广泛 受到 关注 六 。 半 监督 
学 习 思 想 产 生 于 20 世 纪 60 年 代 ， 一 般 认 为 其 真正 的 研究 工作 始 于 
Shahshahani 和 Landgrebefq 所 提出 的 半 监 督学 习 理 论 。 充 足 且 准确 
的 训练 样本 是 提高 分 类 精度 的 重要 条 件 之 一 ， 遥 感 影像 本 身 具 有 复 
杂 性 、 随 机 性 等 特点 ， 且 人 为 选取 样本 总 是 存在 经 验 、 知 识 有 限 和 
盲目 选择 等 缺点 ， 这 些 造成 所 选择 的 分 类 样本 不 足 且 代 表 性 不 好 ， 
如 果 仅 使 用 少量 “昂贵 的 ”有 标签 样本 而 不 利用 大 量 “ 廉 价 的 ”未 
标签 样本 ， 则 是 对 数据 资源 的 极 大 浪费 。 因 此 ， 在 标签 样本 较 少 
时 ， 如 何 利用 大 量 的 未 标签 样本 来 改善 学 习性 能 具有 重要 的 理论 价 
值 和 应 用 意义 。 不 同 的 论著 、 不 同 的 研究 者 对 半 监 督 涉及 方法 的 研究 
方向 有 不 同 的 划分 。 通 常 ， 按 其 工作 方式 可 以 大 致 分 为 以 下 几 类 。 
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1. 基于 EM(Expectation-Maximization) 的 半 监 督学 习 算法 

EM 算法 “TI 是 一 种 模型 构造 法 ， 基 于 聚 类 假设 ， 是 半 监 督学 
习 中 提出 的 比较 早 的 一 种 学 习 方 法 。EM 算 法 利用 无 标签 样本 反复 
估计 和 修正 有 标签 样本 获得 假设 中 的 模型 参数 ， 直 到 模型 中 的 参数 
不 再 变化 或 者 几乎 不 再 变化 为 止 。 

EM 方法 在 遥感 分 类 领域 有 以 下 局 限 性 : 

(1) 如 果 假 设 的 模型 与 实际 不 符 ， 将 会 导致 较 大 的 错误 率 。 一 
般 而 言 ， 在 未 标记 样本 数量 足够 大 的 时 候 可 以 得 到 符合 影像 中 各 类 
别 地 物 像 素 实际 分 布 的 、 较 为 合理 的 先 验 概率 ， 但 当 其 数量 不 是 很 
大 时 ， 因 未 标记 样本 选择 的 随机 性 ， 影 像 也 可 能 会 出 现 分 布 较 少 类 
别 未 能 选取 到 样本 或 样本 数量 极 少 而 使 其 比例 失衡 ， 结 果 导 致 影像 
中 分 布 较 少 的 弱势 类 别 无 法 被 正确 划分 。 

(2) 基于 生成 模型 的 分 类 中 ， 混 合成 分 之 间 的 重 盔 也 是 影响 最 
终 分 类 精度 的 重要 因素 之 一 。 

2. 基于 协作 训练 (Co-training) 半 监督 学 习 算法 

协作 学 习 法 5" 隐 含 地 利用 了 聚 类 假设 或 者 流 形 假设 ， 其 主 
要 思想 是 把 样本 划分 为 两 个 子 集 ， 且 满足 下 述 条 件 : 一 是 每 个 特征 
子 集 都 是 充足 的 训练 样本 ， 即 在 每 个 特征 子 集 上 都 足以 训练 一 个 好 
的 分 类 器 ， 二 是 对 于 指定 类 别 标签 ， 每 个 特征 子 集 条 件 都 独立 于 另 
一 个 特征 子 集 ， 即 这 两 个 特征 子 集 必须 在 给 定 类 别 的 条 件 下 独立 分 
布 。 在 学 习 过 程 中 ， 首 先 根据 两 个 子 集 分 别 训练 两 个 独立 的 分 类 
器 ， 这 两 个 学 习 器 挑选 若干 个 标记 置信 度 高 的 未 标记 样本 进行 相互 
标记 ， 从 而 使 对 方 利用 这 些 新 标记 的 样本 进行 更 新 ， 这 个 过 程 不 断 
迭代 进行 ， 直 到 满足 某 个 停止 条 件 。 缺 点 是 该 方法 对 样本 的 特征 空 
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间作 了 很 强 的 假设 。 

3. 基于 TSVM(Transductive Support Vector Machines) 半 监督 学 习 算法 

20 世 纪 70 年 代 中 期 出 现 了 直 推 式 学 习 方法 的 主要 思想 ， 后 来 由 
Joachims 忆 将 该 思想 结合 SVM 提出 直 推 式 支 持 向 量 机 (Transductive 
SVM，TSVMD) 方 法 。TSVM 是 基于 标准 SVM 的 一 个 扩展 来 解决 半 监 
督学 习 问 题 的 ， 它 不 是 直接 将 无 标签 样本 点 加 入 到 标准 SVM 的 优化 
函数 中 得 到 最 优 解 ， 而 是 试图 不 改变 SVM 的 优化 机 理 ， 逐 步 通 过 标 
准 SVM 的 训练 算法 修改 划分 超 平面 ， 并 交换 超 平面 两 侧 某 些 未 标签 
样本 的 可 能 标签 ， 将 无 标签 样本 转化 为 有 标签 样本 ， 使 得 SVM 在 所 
有 训练 数据 (包括 有 标签 和 无 标签 样本 点 ) 上 最 大 化 间隔 (Margin)， 
从 而 得 到 一 个 既 通 过 数据 相对 稀疏 的 区 域 又 尽 可 能 正确 划分 有 标签 
样本 的 超 平面 。 目 前 ，TSVM 在 遥感 影像 分 类 中 还 没有 引起 足够 的 
重视 ， 为 数 不 多 的 研究 成 果 中 较 有 代表 性 的 是 Bruzzone 等 5 以 及 
Tuia 和 Camps-valls55 的 工作 。 该 算法 的 一 个 弱点 是 需要 事先 确定 属 
于 某 个 类 别 未 标记 样本 的 具体 数目 ， 对 于 遥感 影像 中 的 地 物 分 类 ， 
事先 估计 某 个 类 别 样本 的 具体 比例 或 者 数目 ， 是 不 可 行 也 不 可 能 
Hg, 一旦 错误 估计 ， 对 分 类 结果 的 影响 将 是 灾难 性 的 。 

4. 基于 自 训 练 (Self-training) 半 监督 学 习 算 法 

自 训 练 法 "9 中 "I 是 半 监 督学 习 的 一 种 比较 常用 的 方法 。 自 训练 法 
首先 利用 有 标签 样本 训练 一 个 分 类 器 ， 然 后 用 此 分 类 器 对 所 有 无 标 
签 样本 进行 分 类 ， 并 给 每 个 无 标签 样本 标 上 相应 的 类 别 标签 和 置信 
度 ; 再 将 置信 度 高 的 样本 连同 它 的 类 别 标签 合并 到 训练 集中 继续 训 
练 分 类 器 ;重复 上 述 过 程 直至 结束 条 件 满足 。 这 种 方法 的 缺点 是 在 
学 习 过 程 中 ， 一 旦 某 个 分 类 出 错 ， 将 导致 这 个 错误 被 继续 学 习 和 加 
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强 ， 即 出 现 所 谓 的 错误 累积 现象 。 为 了 避免 这 种 情况 的 发 生 ， 通 常 
为 算法 设置 一 个 阔 值 ， 当 未 标注 样本 分 类 预期 值 小 于 该 阔 值 时 ， 算 
法 便 认为 该 样本 为 无 效 样本 值 ， 不 将 其 加 入 到 标注 样本 训练 集中 ， 
以 控制 错误 信息 的 输入 。 


85$2.44 半 监 督 分 类 中 的 聚 类 算法 


半 监 督 分 类 中 的 聚 类 FT 作为 一 种 从 无 标记 样 例 中 提取 信息 的 
方法 ， 目 的 在 于 改进 分 类 任务 。 遥 感 影像 数据 可 被 分 类 的 前 提 是 属于 
同一 个 类 别 的 影像 单元 在 特征 空间 中 具有 聚 类 的 特点 ， 且 各 类 别 之 间 
在 特征 空间 中 的 样本 点 是 稀疏 的 ， 这 种 聚 类 的 特点 表现 为 一 种 全 局 
的 特征 ， 同 时 满足 基于 生成 模型 和 基于 直 推 式 学 习 的 前 提 假 设 。 

除了 上 述 这 些 半 监督 学 习 方法 外 ， 还 包括 基于 流 形 或 图 谱 的 一 
些 图 正则 化 框架 的 半 监 督学 习 方 法 中。 


8$2.5 ”集成 学 习 理 论 及 研究 进展 


集成 学 习 (Ensemble learning) 也 是 当今 机 器 学 习 的 研究 热点 
之 一 ， 弱 强 学 习 算 法 之 间 的 转化 思想 是 集成 学 习 的 理论 基础 ， 即 
Kearns 和 Valianteq 所 提出 的 是 否 可 以 将 弱 可 学 习 算法 提升 为 强 可 学 
习 算 法 ， 如 果 两 者 等 价 ， 那 么 在 学 习 概念 时 ， 只 需要 找到 一 个 比 随 
机 猜测 略 好 的 弱 可 学 习 算法 ， 通 过 某 种 形式 的 转换 ， 就 可 以 将 其 提 


| 34 | 基于 机 器 学 习 的 遥感 影像 分 类 方法 研究 


类 、SVM、 决 策 树 等 ， 由 此 产生 了 狭义 、 广 义 集 成 学 习 的 概念 。 

狭义 定义 : 集成 学 习 是 综合 多 个 同 构 的 学 习 机 来 对 同一 个 问题 
进行 学 习 。 同 构 指 集成 中 的 所 有 程序 学 习 机 属于 同一 种 类 型 ， 集 成 
在 某 输入 示例 下 的 输出 由 构成 集成 的 个 体 学 习 器 在 该 示例 下 的 输出 
共同 决定 。 

广义 定义 : 集成 学 习 是 用 有 限 个 学 习 器 对 同一 个 问题 进行 学 
习 。 学 习 器 可 以 是 任何 类 型 ， 集 成 在 某 输 入 示例 下 的 输出 由 构成 集 
成 的 个 体 学 习 器 在 该 示例 下 的 输出 共同 决定 。 

集成 学 习 直 到 20 世 纪 90 年 代 才 逐步 受到 重视 ， 在 许多 领域 获 
得 了 优异 的 效果 。 如 ，Wolpert" "提出 Stacked Generalization 算 法 ; 
Perrone 和 Cooper 中 "提出 了 可 以 大 幅 提 升 回 归 估 计 性 能 的 集成 方法 
理 路 框架 ，Jordan 和 Jacobs[ 介 绍 了 一 个 分 级 混合 专家 模型 ，Battiti 
和 Collar 证 明 规 模 神经 网 络 之 间 的 错误 相关 性 足够 小 ， 那 么 它们 集 
成 的 性 能 也 要 大 大 超过 最 好 的 独立 神经 网 络 个 体 ，Lam 和 Suen53 比 
较 了 多 种 分 类 器 组 合 方法 ， 通 过 遗传 算法 获得 权重 ， 发 现 当 训练 集 
不 完善 时 ， 简 单 的 多 数 投票 是 最 可 靠 的 方式 ，Breimanr9q 从 可 重复 
取样 技术 入 手 ， 提 出 了 著名 的 Bagging 算 法 ，Freund 和 Schapirer” 改 
进 了 Boosting 算 法 ， 进 一 步 提 出 了 自 适 应 Boosting(AdaBoost) 算 法 ， 
目前 AdaBoost 已 成 为 最 流行 的 Boosting 方 法 ; Dietterich Az ze T HE 
成 学 习 评论 ， 将 集成 学 习 列 为 机 器 学 习 的 四 大 研究 方向 的 首位 ; 
Huang 等 "将 神经 网 络 集成 用 于 图 像 在 深度 方向 上 发 生 偏转 多 姿态 
的 人 脸 识别 ;Collobert 等 "通过 将 训练 集 划分 为 多 个 不 相交 的 子 集 
并 在 每 个 子 集 上 构建 个 体 SVM， 最 后 将 个 体 的 预测 结果 加 权 平 均 
作为 集成 的 输出 Valentini 等 采用 特征 选择 方法 解决 维 数 灾难 问 
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题 ， 并 采用 Bagging 技 术 克 服 由 于 小 样本 和 生物 差异 性 导致 的 方差 
问题 ，Liu 等 四 构建 随机 C4.5 决 策 树 集成 ， 获 得 了 远 好 于 支持 向 量 
机 集成 的 分 类 结果 :Hu 等 中 和 Mei 等 史 利 用 粗糙 集 理论 把 输入 特征 
空间 分 成 多 个 特征 子 空间 ， 运 用 各 子 空间 训练 SVM 成 员 分 类 器 ， 最 
后 进行 集成 ，Archibald and Fann" 提出 SVM 的 特征 集成 选择 分 类 方 
法 ， 取 得 准确 的 结果 ， 并 有 效 地 降低 了 计算 复杂 度 ; Pal" 提出 多 
SVM 分 类 器 集成 方法 ，Chen 等 中 研究 了 成 对 决策 树 SVM 的 集成 对 高 
光谱 数据 分 析 ， 实 验 结果 与 One-against-oneSVM 相 似 ， 这 主要 取决 
于 基于 决策 树 方法 的 层次 结构 ，Ghoggali 等 四 利用 遗传 算法 和 SVM 
集成 利用 有 限 可 用 训练 样本 对 遥感 数据 分 类 ， 分 类 精度 大 幅 提 高 ; 
Mukhopadhyay 和 MaulikB 将 多 目标 模糊 聚 类 与 SVM 集成 进行 非 监督 
分 类 ; 邬 俊 等 四 提出 一 种 基于 偏 祖 性 半 监 督 集成 的 SVM 主动 反馈 技 
术 ， 在 集成 学 习 框 架 中 使 用 未 标记 数据 以 增加 个 体 分 类 器 之 间 的 差 
异性 ， 还 设计 一 种 偏 祖 加 权 策 略 ， 使 得 集成 分 类 模型 对 正 样本 给 予 
更 大 的 关注 程度 ， 以 应 对 正 负 样 本 间 的 不 对 称 分 布 问题 ; 杨 娜 等 上 
提出 基于 SVM 无 限 集成 学 习 方 法 ， 并 将 其 应 用 于 遥感 图 像 分 类 ， 结 
果 表 明 可 显著 提高 遥感 图 像 的 分 类 精度 。 

以 上 集成 方法 思路 分 别 侧重 于 两 个 步骤 : 首先 使 用 特殊 程序 来 
生成 个 体 分 类 器 ， 然 后 选择 特定 的 策略 来 组 合 分 类 器 。 

从 以 上 论述 不 难看 出 ， 半 监督 学 习 和 集成 学 习 是 机 器 学 习 两 个 
重要 方法 ， 在 过 去 几 十 年 ， 二 者 取得 了 巨大 成 功 ， 然 而 两 个 方法 的 
发 展 几乎 是 并 行 的 ， 只 有 少数 研究 涉及 二 者 的 结合 。 如 何 有 效 地 将 
半 监 督学 习 、 集 成 学 习 融 合 ， 并 将 其 应 用 于 SVM 分 类 模型 ， 是 提高 
SVM 分 类 器 泛 化 能 力 的 一 个 崭新 思路 。 
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8$3.1. 研究 区 位 置 及 遥感 影像 集 


3.1.1 研究 区 位 置 


本 研究 以 图 们 江 下游 ， 中 、 朝 、 俄 交界 处 作为 研究 对 象 。 其 中 
包括 中 国 吉 林 、 俄 罗斯 滨海 边疆 区 Primorskiy kray， 以 及 朝鲜 咸 镜 北 
道 Korea Hamgyeongbuk-do。 其 地 理 位 置 大 约 在 41” 06' ~44° 05'N 与 
127*39' ~131° 44'E 之 间 ， 如 图 3-1 所 示 。 该 区 地 处 温带 大 陆 性 季风 
气候 区 ， 冬 季 盛 行 西北 风 ， 夏 季 以 东南 风 为 主 。 气 候 的 垂直 变化 明 
显 ， 气 温 的 年 差 较 小 ， 雨 量 比较 充足 ， 水 、 热 同 季 。 受 日 本 海 的 影 
响 ， 冬 季 比 较 上 暖和， 夏季 比较 凉爽 。 


(a) 研究 区 位 置 


图 3-1 研究 对 象 的 地 理 位 置 
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Legend 


test area 
North Korea Hamgyong-buk to 


e LZ] China Hei longjiang 
China Jilin 


E75] Russia Primorskiy kray 


(b) 位 于 研究 区 内 的 验证 区 域 


A 


(c) 覆盖 研究 区 TM 遥感 影像 (5.4.3 波 段 合成 ) 
图 3-1 研究 对 象 的 地 理 位 置 ( 续 ) 
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图 们 江 地 区 是 东北 亚 地 区 的 中 央 区 位 ， 具 有 独特 的 区 位 优势 ， 
随 着 图 们 江 地 区 的 开发 开放 ， 它 的 战略 地 位 再 度 提升 。 通 过 有 效 的 
分 类 方法 对 图 们 江 地 区 进行 土地 利用 /覆盖 信息 提取 ， 可 为 图 们 江 地 
区 土地 利用 /覆盖 动态 变化 过 程 分 析 提 供 科学 的 依据 ， 为 中 、 朝 、 俄 
土地 利用 差异 的 比较 提供 技术 保障 吕 。 


3.1.2 ”研究 区 影像 集 


本 研究 选取 行列 号 115-30 遥 感 影像 ， 包 括 : 1992-10-07、 
2001-08-31、2001-10-02、2006-05-17、2006-09-22、2009-09-30 近 20 
年 的 6 幅 不 同时 相 的 Landsat TM/ETM 影 像 (30 米 空间 分 辩 率 ，UTM 投 
影 )， 数 据 集 详 见 表 3-1。 

表 3-1 研究 区 遥感 影像 数据 集 

ip 空间 分 辨 率 影像 类 型 

1992 Landsat TM 

2001 Landsat ETM 


2006 05-17 09-22 Landsat TM 
2009 09-30 Landsat TM 


3.1.3 分 类 体系 的 建立 


土地 覆盖 类 型 的 确定 是 土地 资源 调查 和 监测 的 基础 ， 也 是 开展 
本 项 研究 的 前 提 叫 外。 没有 一 个 理想 的 土地 覆 被 分 类 系统 适用 于 所 
有 需求， 不 同 的 目标 制定 不 同 的 分 类 系统 。 对 于 特定 的 、 局 部 的 应 
用 服务 ， 可 以 制定 反映 应 用 目标 特征 、 类 型 精细 的 土地 覆盖 类 型 ， 
对 于 大 区 域 或 多 目标 应 用 服务 ， 可 以 制定 类 型 定义 宽泛 的 分 类 系 
统 四 。 本 书 依据 联合 国 粮 农 组 织 提出 的 土地 覆盖 分 类 体系 (Land Cover 
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Classification System，LCCS) 和 中 国 科学 院 资源 环境 数据 库 土 地 利用 
分 类 系统 ， 从 遥感 制图 角度 和 中 、 朝 、 俄 交界 处 所 处 北 温带 等 特点 出 
发 ， 建 立 了 研究 区 土地 覆盖 遥感 分 类 体系 ， 详 见 表 3-2， 该 体系 采用 
二 级 分 类 系统 ， 第 一 级 分 为 6 个 类 型 ， 第 二 级 包括 9 个 类 型 。 


表 3-2 ”研究 区 土地 覆盖 遥感 分 类 体系 
a xX 


森林 工 林 
邦 闭 度 >30%， 高 度 >2m 的 针 冰 混 交 天 然 林 和 人 
工 林 
[HEA | 郁 闭 度 >40%， 高 度 >2m 的 灌 从 和 做 林 
草地 ”| 典型 草地 | 覆盖 度 10~3096， 以 旱 生 草本 为 主 的 草地 
农田 — [sm | 无 灌溉 水 源 及 设施 ， 靠 天 然 降水 生长 作物 的 耕地 
建筑 用 地 | 居住 地 ”| 人工 硬 表面 ， 居 住 建筑 


水 体 内 陆 水 体 ”| 陆地 上 各 种 淡水 湖 、 咸 水 湖 、 水 库 及 坑 塘 、 河 流 


地 表 为 土质 、 植 被 覆盖 度 在 5% 以 下 的 裸 土地 、 
iun 盐碱地 等 无 植被 地 段 


党 3.2 遥感 影像 数字 集 


32.4 样本 采集 


1. 波段 合成 
样本 的 有 效 采 集 依 赖 于 遥感 影像 波段 准确 的 合成 。 随 着 遥感 技 
术 的 不 断 发 展 ， 光 谱 遥 感 图 像 的 种 类 也 随 之 增加 。 大 多 数 多 光谱 遥 
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感 图 像 包 含 3 一 10 个 相对 较 宽 的 波段 。 例 如 : Aerial Photography, 
Landsat Multispectral Scanner(MSS)、Landsat Thematic Mapper(TM, 
ETM+)、SPOTUHRV)、IKONOS 与 QuickBird 辐 。 不 同 波段 有 不 同 的 
用 途 、 波 长 范围 和 统计 特征 ， 响 应 不 同 地 物 在 该 波段 内 的 辐射 、 反 
射 特性 。 正 是 由 于 波段 与 地 物 间 有 这 些 相关 特性 ， 才 可 以 用 地 物 在 
不 同 光谱 范围 的 反射 程度 和 波段 的 组 合 来 识别 地 物 四 。 其 中 本 书 采 
用 的 TM 多 光谱 影像 包括 7 个 波段 ， 如 表 3-3 所 示 。 


A23 TM 传感器 波段 特征 
S là 光谱 效应 


对 水 体 有 穿 透 能 力 ， 用 来 分 析 植 被 
特征 、 土 地 利用 及 编制 森林 分 布 图 
对 水 体 的 穿 透 能 力 较 强 ， 对 植被 的 
反射 敏感 ， 能 区 分 树种 、 林 型 

位 于 叶绿素 的 吸收 区 ， 能 增强 植被 
获 盖 与 无 植被 覆盖 的 反差 ， 可 判断 


0.45~0.52 


0.52~0.60 


集中 反映 植物 的 强 反 射 ， 用 于 生物 
0.75—0.96 | i 量 、 植 被 类 型 和 作物 长 势 的 调查 ， 
可 绘制 水 体 边界 

处 于 水 的 吸收 带 ， 对 含水 量 反应 敏 
1.55 一 1.75 感 ， 可 用 于 植物 含水 量 、 土 壤 湿度 调 
查 和 作物 长 势 分 析 

对 热 异 常 敏感 ， 可 监测 人 类 活动 的 
104—125| # 热 特 征 ， 用 于 热 分 布 制图 、 岩 石 识 
别 和 地 质 探矿 

探测 高 温 辐射 源 ， 如 监测 森林 火 
灾 、 火 山 活动 等 ， 可 区 分 岩石 类 型 


波段 合成 通常 采用 3 个 波段 进行 假 彩 色 合成 ， 从 TM 的 7 个 波段 
任 选 3 个 波段 进行 组 合 ， 加 之 3 个 波段 所 赋 基 色 的 不 同 ， 其 合成 方案 
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总 数 多 达 200 多 种 ， 因 此 ， 如 何 选择 最 佳 组 合 方案 值得 深入 研究 ， 
波段 的 选取 通常 考虑 3 OT A, 

(1) 波段 或 波段 组 合 信息 含量 的 多 少 ; 

(2) 各 波段 之 间 相 关 性 的 强 弱 ; 

(3) 研究 区 内 欲 识 别 地 物 的 光谱 响应 特征 如 何 。 

信息 含量 多 、 相 关 性 小 、 地 物 光 谱 差 异 大 、 可 分 性 好 的 波段 就 
是 应 该 选择 的 最 佳 波段 。 许 多 学 者 采用 最 佳 指数 因子 (OIF) 并 综合 地 
物 的 光谱 特征 进行 分 析 与 研究 得 出 : 543 波 段 组 合 为 土地 利用 /覆盖 
信息 提取 的 最 佳 波 段 组 合 ， 其 合成 的 假 彩色 遥感 影像 具有 更 好 的 目 
视 效果 ， 可 很 好 地 用 于 土地 利用 /土地 覆 被 的 目 视 解 译 与 计算 机 分 
类 9。 因此 ， 本 书 以 TM543 波 段 组 合 图 像 进行 样本 提取 。 

2. 采样 方法 

采样 方法 在 某 种 程度 上 比分 类 算法 的 选择 更 为 重要 中 。 为 确保 
样本 的 代表 性 、 有 效 性 ， 本 书 采样 方法 选择 概率 采样 。 常 用 的 概率 
采样 方法 包括 简单 随机 采样 、 分 层 采样 、 系 统 采样 以 及 聚 点 式 集群 
采样 等 。 具 体 采 用 哪 种 方法 ， 应 考虑 分 类 系统 和 应 用 目的 影响 ， 依 
据 精度 评价 而 定 59。 当 样本 数量 较 大 时 ， 宣 采用 简单 随机 采样 方 
法 中 ， 而 且 作为 最 基本 的 采样 方法 ， 简 单 随机 采样 应 用 广泛 ， 能 够 
满足 大 多 数 用 户 的 需求 "9。 因 此， 本 书 采用 简单 随机 采样 方法 采集 
训练 样本 和 测试 样本 。 此 外 ， 样 本 选取 的 模板 窗口 大 小 须 合适 ， 基 
本 原则 是 应 该 稍 大 于 空间 特征 单元 的 大 小 。 如 果 窗 口 选取 太 小 ， 则 
影响 信息 提取 的 精度 ， 而 窗口 太 大 ， 影 响 训练 效率 而 且 并 不 一 定 能 
提高 精度 ， 不 同 大 小 的 模板 ， 能 提取 不 同 粗细 的 特征 信息 "DT9。 
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3.2.2 ”特征 选取 


用 于 分 类 的 特征 选择 旨 在 提高 分 类 器 的 泛 化 能 力 ， 降 低 维 数 和 
计算 复杂 性 。 它 在 充分 保留 分 类 信息 的 同时 ， 通 过 选取 特征 子 集 直 
接 降 低 原始 特征 维 。 特 征 选择 已 成 为 分 类 问题 中 的 研究 热点 PP。 
通常 根据 下 面 的 准则 选取 最 小 化 的 特征 子 集 ": 

(1) 分 类 精度 不 会 明显 降低 ; 

(2) 特征 选取 后 的 类 别 分 布 特点 与 特征 选取 前 原始 的 类 别 分 布 
特点 尽 可 能 地 接近 。 

考虑 到 数据 维 数 及 算法 复杂 度 ， 本 文采 用 8 个 属性 特征 ， 具 体 
包括 TM 影像 的 波段 信息 、PCA 主 成 分 分 析 、NDVI 植 被 指数 。 

首先 对 于 TM 波段 选取 ， 由 于 TM 影像 的 第 6 波段 是 热 红 外 波 
段 ， 其 空间 分 辨 率 较 低 (空间 分 辩 率 为 120m)， 一 般 不 参与 波段 的 合 
成 。 因 此 ， 研 究 中 不 把 第 6 波段 考虑 在 内 ， 波 段 特 征 包 括 TM 影 像 的 
1 一 5 波段 、7 波 段 共计 6 个 波段 。 

遥感 图 像 波段 之 间 存 在 很 强 的 相关 性 ， 从 而 导致 各 波段 图 像 
之 间 存 在 相似 的 信息 和 结构 特征 外， 造成 了 匈 余 信息 。 主 成 分 分 析 
(PCA) 是 一 种 正 交 分 解 (Proper Orthogonal Decomposition，POD) 算 
法 ， 等 同 于 Karhunen-Loeve 分 解 (Karhunen-Loeve Decomposition, 
KLD) 和 奇异 值 分 解 (Singular Value Decomposition, SVDP., Æ 
分 分 析 经 常 被 用 于 多 光谱 遥感 图 像 的 特征 提取 和 图 像 压缩 中 PP ， 
用 于 去 除 多 光谱 遥感 图 像 各 个 波段 间 的 重复 性 和 宛 余 信息 。 为 了 
更 好 地 比较 主 成 分 分 析 后 波段 所 含 信息 量 的 多 少 ， 本 章 以 研究 区 
2006-9-22 获 取 的 TM 影像 进行 PCA 试 验 ， 结 果 如 图 3-2 所 示 。 
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(b) PCA-band 2 


图 3-2 ”研究 区 部 分 区 域 PCA 主 成 分 分 析 结果 
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(c) PCA-band 3 


(d) PCA-band 4 


图 3-2 研究 区 部 分 区 域 PCA 主 成 分 分 析 结 果 ( 续 ) 
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(f) PCA-band 6 


图 3-2 研究 区 部 分 区 域 PCA 主 成 分 分 析 结 果 ( 续 ) 
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(g) PCA-band 7 


(h) NDVI 


图 3-2 研究 区 部 分 区 域 PCA 主 成 分 分 析 结 果 ( 续 ) 


YE: 其 中 (a) 一 (加 分 别 为 band 1—band 7 主 成 分 分 析 结果 ，(b) 为 该 研究 
区 植被 指数 (NDVD 分 析 结 果 。 
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在 图 3-2(a) 中 明显 能 看 出 band 1 所 包含 信息 量 最 为 丰富 ， 相 比 
ZF, band 6( 图 3-2(D) 和 band 7( 图 3-2(g)) 波 段 信息 量 很 少 ， 基 本 都 
是 噪声 。 为 了 更 好 的 比较 ， 本 章 也 分 别 列 出 相应 波段 PCA 特 征 统计 
表 和 特征 统计 图 ， 如 图 3-3 及 表 3-4 所 示 。 根 据 图 3-3 和 表 3-4 也 可 看 
出 ，TM 所 包含 的 7 个 波段 中 ，band 1、band 2 和 band 3 特征 值 较 大 ， 
证 明 包含 信息 量 较 多 ， 并 且 前 3 个 波段 里 以 band 1 特征 值 最 大 ， 为 
493.317 5。 因 此 ， 本 书 选择 PCA 第 一 主 分 量 作为 其 中 一 个 分 类 特征 。 


PCA 
500 g--------- i ‘rain ‘aoe ae aaa 


w 
e 


NY N 
e 


Eigenv alue 


Einenvalue Nurnber 


图 3-3 PCA 主 成 分 分 析 特 征 统计 表 


表 3-4 ”PCA 主 成 分 分 析 特 征 统计 表 
PC Eigenvalue Percent 
Band 1 493.317 5 74.48% 
Band 2 123.619 8 93.14% 
Band 3 28.704 9 97.4796 
Band 4 98.67% 
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( 续 表 ) 
PC Percent 
Band 5 4.5903 99.36% 
Band 6 3.605 8 99.91% 
Band 7 0.604 2 100.00% 


不 同类 型 的 检索 目标 ， 特 征 应 该 是 不 同 的 ， 对 于 某 个 检索 目 
标 内 容 的 描述 ， 不 同 特征 的 有 效 性 也 是 不 一 样 的 ， 如 果 能 够 选择 最 
佳 表示 检索 目标 内 容 的 特征 来 进行 图 像 检索 ， 则 可 以 极 大 地 提高 检 
索性 能 P9。 鉴 于 研究 区 的 主要 土地 覆盖 类 型 为 植被 ， 因 此 最 后 采用 
的 特征 为 归 一 化 植被 指数 。 归 一 化 植被 指数 (Normalized Difference 
Vegetation Index，NDVD) 是 评估 植被 状况 的 最 有 效 参 数 之 一 凹 ， 如 
公式 3-1 所 示 。NDYVI 能 很 好 地 反映 植被 生长 状态 和 植被 覆盖 度 ， 也 
是 衡量 生态 系统 的 重要 信息 ， 试 验 结果 如 图 3-2GD 所 示 ， 从 图 中 不 难 
看 出 研究 区 所 含 植被 信息 丰富 。 


(B, - B,) 
(B, + Bs) 


NDVI = G-1) 


5833. ”本 童 小 结 


本 书 选择 图 们 江 下 游 ， 中 、 朝 、 俄 交界 处 作为 研究 对 象 。 以 
行列 号 115-30 一 景 、 近 20 年 的 6 幅 不 同时 相 的 Landsat ETM/TM 影 像 
作为 研究 材料 ， 分 别 讨论 本 书 所 采用 的 影像 合成 方式 、 特 征 采集 方 
法 、 土 地 覆盖 分 类 依据 ， 以 及 特征 选取 方法 ， 为 进一步 研究 分 类 方 
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4.1 SVM 理论 及 参数 优化 算法 研究 
进展 


4.4.4 SVM 的 核心 思想 


SVM 的 核心 思想 是 把 样本 通过 非 线性 映射 投影 到 高 维特 征 空 
间 ， 以 结构 风险 最 小 化 原理 (Structural Risk Minimization，SRMD) 为 原 
则 ， 在 高 维特 征 空间 中 构造 VC 维 (Vapnik-Chervonenkis Dimension， 
即 描述 函数 集 或 学 习 机 器 的 复杂 性 )， 以 尽 可 能 低 的 最 优 分 类 超 平面 
作为 分 类 面 ， 使 分 类 风险 上 界 最 小 化 ， 从 而 使 分 类 算法 具有 最 优 的 
推广 能 力 。 其 中 核 函数 及 其 参数 选择 是 SVM 面 对 的 重要 而 困难 的 问 
题 ， 对 提高 遥感 影像 分 类 精度 是 非常 重要 的 。 


4.1.2 SVM 理论 


VapnikO 所 提出 SVM 理论 是 在 20 世 纪 90 年 代 中 期 不 断 发 展 和 成 
熟 的 。SVM 是 一 种 新 的 、 有 效 的 统计 学 习 方 法 ， 是 近年 来 模式 识别 
与 机 器 学 习 领 域 的 一 个 新 的 研究 热点 。 

SVM 的 主要 思想 是 建立 一 个 超 平面 作为 决策 曲面 ， 使 得 正 例 和 
反例 之 间 的 隔离 边缘 (Margin Width) 被 最 大 化 。 如 图 4-1 所 示 的 两 维 
情况 ， 图 中 实心 点 和 空心 点 代表 两 类 样本 ， 虚 线 为 分 类 线 ， 两 条 实 
线 分 别 为 各 类 中 离 分 类 线 最 近 的 样本 且 平 行 于 分 类 线 的 直线 ， 它 们 之 
间 的 距离 叫做 分 类 间隔 (Margin)。 所 谓 最 优 分 类 线 就 是 要 求 分 类 线 不 
但 能 将 两 类 正确 分 开 (训练 错误 率 为 0)， 而 且 要 使 分 类 间隔 最 大 。 
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Instances 


SVM Hyperplane 
图 4-1 SVM 理论 描述 


SVM 不 仅 考虑 了 对 渐进 性 能 的 要 求 ， 而 且 追 求 在 有 限 信息 的 条 
件 下 得 到 最 优 结果 ， 避 免 了 人 工 神经 网 络 等 方法 的 网 络 结构 选择 、 
过 学 习 和 从 学 习 以 及 局 部 极 小 等 问题 。 其 线性 可 分 模式 的 最 优 超 平 
面 的 推导 如 下 : 
考虑 训练 样本 {x;，yi}Y， 其 中 x 是 输入 模式 的 第 i 个 样本 ， 
yECl, +1}. 
设 用 于 分 离 的 超 平面 方程 是 : 
e + x+b=0 (4-1) 
HPoRW ANDAR, DEE, ZIRE No Alb yo, 
和 2， 则 最 优 的 分 类 超 平面 为 ; 
wrth =0 (4-2) 
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满足 下 面条 件 的 特殊 数据 点 称 为 支持 向 量 {x;，3}， 且 满足 : 


o * x+b=1, y=l (4-3) 
或 者 
w *xjtb--l, y=-1 (4-4) 
此 处 设 x, 和 x 为 两 个 支持 向 量 ， 且 满足 : 
o» xytb-l (4-5) 
e * xytb--1 (4-6) 
公式 (4-5) 与 公式 (4-6) 相 减 可 得 : 
@ * (x,7x3)-2 (4-7) 


2 2 
进而 可 得 Margin Width) “0 一 六 )= loj IU | SCR Slol 


最 小 化 = PL gas. 
且 对 于 任意 的 (x;，y) 有 : 


Q*x, *bx-l y, 7-1 
(4-8) 
Q*Xx, *bZl, y, 21 
可 得 : 
y(o *x+b)21 (4-9) 


寻找 最 优 超 平面 即 正 反 例 间 隔 最 大 化 问题 ， 最 终归 结 为 一 个 二 
次 规划 问题 ， 可 使 用 Lagrange 乘 子 法 解决 。 


首先 建立 lagrange 函 数 : 
Jb.) Lo o Yay (o «x, + (4-10) 
i=l 
其 中 o 称 为 Langrange 乘 子 。 对 w，2 求 偏 导 并 置 零 ， 有 : 
eJ N 
5g 590-2895 (4-11) 
eJ x 
0 (4-12) 
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最 终 可 以 得 到 原 问题 的 对 侦 问题 : 
maxQ(0)= Joba) =} a- Dap (413) 


N 
Yay, 204,20 (4-14) 
i=l 


车 数据 非 线性 可 分 ， 可 以 引入 一 个 非 线性 映射 : 一 p(s) 将 
其 训练 数据 映射 到 高 维特 征 空间 中 ， 使 之 在 这 个 高 维 空间 中 线性 
可 分 ， 但 由 于 没有 数据 的 先 验 知识 ， 这 个 非 线性 映射 是 很 难 知道 
的 。SVM 的 一 个 很 重要 的 特点 就 是 引入 一 个 核 函 数 K(x， 羽 来 代替 
高 维 空间 中 的 内 积 ， 如 图 4-2 所 示 ， 将 样本 点 从 低 维 空间 映射 到 高 维 
Hilbert 空 间 ， 在 高 维特 征 空间 中 设计 线性 最 优 分 离 超 平面， 得 到 输 
入 空间 中 的 非 线性 学 习 算法 ， 使 低 维 非 线性 问题 转化 为 高 维 线性 可 
分 问题 。 引 入 核 函 数 后 ， 公 式 (4-13) 可 表示 为 : 
maga- a, aayy KE) — Gas 
设 最 优 Lagrange 乘 子 为 a， 则 最 终 的 最 优 判别 函数 为 : 


fG) sign a s Ko ) b) 4-16) 


Input Space Feature Space 
图 4-2” 核 函数 参数 实现 数据 集 的 高 维 空间 非 线性 映射 


下 面 列 出 几 种 常用 的 核 函 数 : 
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(1) 线性 核 函数 : KQz D=; * x) (4-17) 

Q) 多 项 式 核 函数 : Ku, x)yx* xl, 其 中 4 为 自然 数 (4-18) 
1 2 

G) 径 向 基 核 函数 : K(x;,x) = expel ) (4-19) 

REE x)cexpCylisxlD (4-20) 

(4) Sigmoid 核 函数 : K(x, x)=tanh(v(x * x,)+c) (4-21) 


4.1.3 SVM 参数 优化 方法 研究 进展 


SVM 分 类 属于 监督 分 类 ， 给 定 训练 样本 及 所 对 应 的 类 别 ， 通 过 
某 种 算法 从 样本 计算 出 分 类 模型 并 将 该 模型 推广 到 待 分 类 点 ， 根 据 
判别 函数 的 指示 ， 最 终 得 出 该 分 类 点 所 属 的 类 别 。SVM 结 构 简 单 ， 
泛 化 能 力 强 ， 容 易 解决 具有 高 维特 征 、 小 样本 与 不 确定 性 等 问题 ， 
已 广泛 应 用 在 遥感 土地 覆盖 分 类 领域 中。 

SVM 的 分 类 参数 主要 指 惩罚 参数 c 和 核 函 数 参 数 。 惩 罚 系 数 < 是 
一 个 重要 的 量 ， 控 制 对 错 分 样本 的 惩罚 程度 。 通 常 ，c 值 越 大 ， 两 
个 超 平面 之 间 的 最 大 间距 越 小 ， 错 分 样本 越 少 ， 训 练 时 间 越 长 ， 反 
之 ， 两 个 超 平面 之 间 的 最 大 间距 越 大 ， 错 分 样本 越 多 ， 训 练 时 间 越 
短 。 每 个 数据 子 空间 至 少 存在 一 个 合适 的 c， 使 得 SVM 推广 能 力 最 
好 。 当 c 超 过 一 定 值 时 ，SVM 的 复杂 度 达 到 了 数据 子 空间 允许 的 最 
大 值 ， 此 时 经 验 风险 和 推广 能 力 几乎 不 再 变化 。 然 而 ， 目 前 还 没有 
一 个 统一 的 方法 来 决定 c 的 最 佳 取 值 。 而 核 参数 的 改变 实际 上 是 隐 
含 地 改变 映射 函数 ， 从 而 改变 样本 数据 子 空间 分 布 的 复杂 程度 ， 即 
线性 分 类 面 的 最 大 VC 维 。 核 函数 取 值 过 小 ， 所 有 的 样本 都 被 视 为 
支持 向 量 ， 故 而 造成 对 新 样本 的 测试 时 间 长 ， 并 且 会 产生 “过 度 拟 
合 ” 现 象 ; 而 当 核 函数 很 大 时 ，SVM 的 性 能 也 会 非常 差 ， 它 对 新 样 
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本 的 正确 分 类 能 力 几 乎 为 零 ， 将 把 所 有 样本 都 判 为 同一 类 。 因 此 ， 
SVM 人 参数 的 正确 选择 对 分 类 器 泛 化 能 力 有 着 重要 的 影响 由。 通常 ， 
SVM 参数 选择 比较 常用 的 方法 包括 穷 举 法 、 网 格 法 和 智能 优化 法 。 

1. FAVE 

该 方法 是 在 模型 选择 以 后 ， 首 先 为 常数 c 和 核 函 数 固 有 的 参数 
赋 初 始 值 ， 然 后 开始 实验 测试 ， 根 据 测试 精度 重复 调整 参数 值 ， 直 
至 得 到 满意 的 测试 精度 为 止 。 王 害 中 在 分 析 SVM 原 理 的 基础 上 ， 分 
析 了 SVM 中 核 函数 、 核 参数 及 惩罚 参数 c 对 分 类 精度 的 影响 ， 利 用 
试 次 法 、 最 优化 法 两 种 方法 对 SVM 人 参数 进行 优化 比较 。 

穷 举 法 基本 是 赁 经 验 调整 参数 值 ， 缺 乏 足够 的 理论 依据 ， 对 不 
同 的 核 函 数 、 不 同 的 样本 ， 其 调整 方法 可 能 不 同 ， 因 此 ， 在 参数 调 
整 过 程 中 带 有 一 定 的 盲目 性 ， 且 当 需 要 较 大 幅度 调整 时 ， 调 整 次 数 
较 多 ， 实 验 比 较 复杂 。 

2. 网 格 法 

网 格 搜索 法 是 将 c 和 核 函数 ( 如 径 向 基 核 函数 参数 旋 分 别 取 M 个 
值 和 N 个 值 ， 用 MxN 个 (c， 力 的 组 合 分 别 训练 不 同 的 SVM， 再 估计 
其 学 习 精度 ， 进 而 在 MxN 个 (c， 力 的 组 合 中 得 到 学 习 精 度 最 高 的 一 
个 组 合作 为 最 优 参数 。 吴 渝 等 四 针对 SVM 分 类 面 过 于 复杂 和 过 学 习 
现象 ， 提 出 基于 网 格 的 最 近邻 SVM 算法 。 李 京华 等 四 针对 网 格 搜索 
SVM 参数 的 方法 存在 复杂 度 高 、 运 算 量 大 等 不 足 ， 提 出 了 一 种 改进 
的 网 格 搜索 SVM 分 类 器 的 最 佳 参数 选择 算法 。Hsu 和 Lin59 利 用 工 
作 集 的 正确 选择 以 及 网 格 搜索 SVM 分 类 参数 提高 分 类 模型 的 泛 化 
能 力 。 

然而 ， 网 格 搜索 法 虽然 可 以 并 行 处 理 多 个 SVM 的 训练 ， 但 其 计 
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算 量 为 CVD)， 因 此 ， 完 成 一 个 完全 的 网 格 搜索 是 非常 费时 的 ， 结 果 
不 是 很 理想 0"。 

3. 智能 优化 法 

鉴于 以 上 两 种 方法 的 缺陷 ， 一 些 学 者 更 倾向 于 利用 智能 算法 
来 选取 SVM 参 数 ， 其 中 以 遗传 算法 (Genetic Algorithms，GA) 和 粒 
子 群 算法 (Particle Swarm Optimization，PSO) 被 采用 的 频次 居多 。 
Fr6hlich 和 Chapelle"" 采 用 GA 实现 SVM 特 征 子 集 的 选择 与 参数 同步 
优化 ， 并 取得 了 很 好 的 效果 。Zheng 和 Jiao03a 利 用 GA 对 SVM 参数 
自动 选取 。 虽 然 GA 相 对 于 网 格 法 和 穷 举 法 在 计算 时 间 上 降低 了 不 
少 ， 但 是 该 算法 对 进化 的 每 一 代 种 群 个 体 都 需要 编码 和 译 码 ， 实 现 
过 程 比较 烦琐 ， 同 时 它 也 缺乏 有 效 的 局 部 搜索 机 制 ， 在 接近 全 局 极 
值 时 收敛 速度 往往 过 慢 ， 获 取 最 优 个 体 的 时 间 代 价 依 然 较 大 。 因 
此 ， 也 有 很 多 学 者 利用 PSO 对 SVM 参数 优化 ，Vahid 等 中 在 解决 控制 
图 模式 识别 问题 中 采用 PSO 实 现 SVM 分 类 器 优化 模型 构建 。Huang 
和 Dun03 利 用 离散 PSO 和 连续 值 PSO 同 时 优化 输入 特征 子 集 ， 并 对 
SVM 核 函数 参数 进行 选择 ， 将 混合 PSO-SVM 分 布 式 运行 以 降低 时 
间 复 杂 度 。 丁 胜 等 (9 采用 PSO 算 法 自动 选择 合适 的 波段 影像 并 对 
SVM 核 函数 参数 进行 优化 ， 提 出 一 种 新 的 PSO-BSSVM 分 类 模型 ， 
对 高 光谱 遥感 影像 的 分 类 试验 ， 比 较 证 明 该 模型 分 类 性 能 更 优 。 尽 
管 在 寻 优 过 程 中 PSO 相 比 GA 方 法 ， 没 有 GA 算法 的 选择 、 交 差 、 变 
异 过 程 ， 算 法 收敛 速度 快 ， 算 法 结构 简单 。 但 PSO 也 同时 存在 着 容 
易 早 熟 收敛 、 搜 索 精 度 较 低 、 后 期 迭代 效率 不 高 等 缺点 。 
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5$42. 基于 自 适 应 变异 粒子 群 参 数 优 
化 的 土地 履 盖 分 类 模型 


专著 针对 传统 PSO 优 化 SVM 参数 存在 早熟 收敛 、 后 期 迭代 效率 
不 高 而 造成 参数 寻 优 不 准确 的 缺点 ， 探 索 了 一 种 基于 自 适应 变异 粒 
子 群 算 法 (Adaptive Mutation Particle Swarm Optimization, AMPSO) 
的 SVM 参数 优化 模型 (AMPSO-SVMJ)。 自 适应 粒子 群 优化 算法 的 主 
要 思想 是 以 粒子 群 的 群体 适应 度 方差 和 全 局 极 值 与 理论 最 优 值 的 
比较 作为 粒子 群 优化 算法 是 否 陷 入 局 部 极 值 的 评价 指标 ， 引 入 变异 
算 子 使 得 算法 能 够 及 时 跳出 局 部 极 值 进而 获得 全 局 最 优 解 ， 接 下 来 
介绍 详细 算法 。 


4.2.1 传统 粒子 群 算法 (PSO) 


粒子 群 优 化 (Particle Swarm Optimization，PSO) 由 Kennedy 和 
Eberhart 等 人 提出 的 模拟 群体 Swarm) 智能 行为 的 优化 算法 (Kennedy， 
1995)。PSO 源 于 对 鸟 群 捕食 的 行为 模拟 ， 每 只 鸟 被 称 为 一 个 粒子 ， 
每 个 粒子 用 其 几何 位 置 和 速度 向 量 表示 凹 。PSO 的 基本 原理 是 将 系 
统 初始 化 为 一 组 随机 解 ， 通 过 迭代 搜寻 最 优 值 。 在 每 一 轮 的 迭代 
中 ， 粒 子 通过 速度 更 新 当前 位 置 ， 并 通过 适应 度 函 数 计算 出 其 适应 
值 ， 最 后 根据 以 下 公式 ， 更 新 粒子 的 当前 速度 和 位 置 。 

Vig" = Vg tena - Xia) + en - Xa) (4-22) 
XP = XE (4-23) 

其 中 ，w%w 是 惯性 系数 ， 为 非 负数 ， ATRX- An X» oc 

Yj)， 它 在 空间 的 飞行 速度 用 三 ( 太 ， 了 成 ，…， 了 1 表示; d=1, 2, 
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3, 5, D; cl 和 c, 是 两 个 正常 数 ， 称 为 学 习 因 子 ; rand 表 示 [0，1] 
的 随机 数 。 公 式 (4-22) 表 示 粒 子 在 第 (rc+D) 次 迭代 时 的 速度 由 第 z 次 
迭代 时 的 速度 和 局 部 最 优 及 全 局 最 优 粒子 位 置 共 同 决定 ， 其 中 ， 
P(Pn，Pis，"…，Pia) 表 示 粒 子 的 局 部 最 优 值 ， 即 粒子 i 到 目前 为 止 
在 搜索 空间 中 的 最 佳 点 ，Pi=(Pa，Poa，…，Psj) 表 示 整 个 粒子 群 的 
ENS, WERE LETRAS. Š 
式 (4-23) 是 粒子 的 位 置 更 新 公式 ， 表 示 粒 子 在 第 (1+1) 次 迭代 的 位 置 
等 于 粒子 在 第 /次 迭代 时 的 位 置 和 速度 之 和 。 和 迭代 终止 条 件 根据 具体 
问题 一 般 选 最 大 友 代 次 数 或 最 优 位 置 满足 预定 最 小 适应 阀 值 。 


42.2 自 适 应 变异 粒子 群 优化 算法 (AMPSO) 


粒子 群 优化 算法 多 采用 实数 编码 ， 没 有 遗传 算法 选择 、 交 差 、 
变异 过 程 ， 算 法 收敛 速度 快 ， 算 法 结构 简单 ， 如 果 某 个 粒子 发 现 一 
个 当前 的 最 优 位 置 ， 其 他 粒子 将 迅速 向 其 靠拢 ， 假 设 该 位 置 非 全 局 
最 优点 ， 仅 为 该 位 置 的 局 部 最 优点 ， 粒 子 将 无 法 在 解 空间 内 重新 搜 
索 ， 进 而 出 现 算法 产生 局 部 最 优 解 ， 即 所 谓 早熟 收敛 现象 。 为 了 克 
服 早熟 收 仇 ， 就 必须 提供 一 种 机 制 ， 当 PSO 发 生 早熟 收敛 之 时 ， 能 
够 跳出 局 部 极 值 ， 进 入 到 解 空间 的 其 他 区 域 继续 搜索 ， 直 到 最 后 
找到 全 局 极 值 。 吕 振 击 和 修志 荣 吕 借鉴 遗传 算法 中 的 变异 思想 ， 在 
PSO 算 法 中 引入 变异 操作 ， 提 出 自 适应 变异 粒子 群 算法 ， 具 体 描述 
如 下 。 

粒子 群 优化 算法 无 论 是 早熟 收敛 还 是 全 局 收敛 ， 粒 子 群 中 的 粒 
子 都 会 出 现 “聚集 ”现象 。 也 许 所 有 粒子 聚集 在 某 一 特定 位 置 ， 也 
许 聚 集 在 某 几 个 特定 位 置 ， 这 主要 取决 于 适应 度 函 数 的 选择 以 及 问 
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题 本 身 的 特性 。 通 常 粒子 位 置 的 一 致 等 价 于 各 粒子 的 适应 度 相同 。 
因此 ， 研 究 粒子 群 中 所 有 粒子 适应 度 的 整体 变化 就 可 以 跟踪 粒子 群 
的 状态 。 为 了 定量 描述 粒子 群 的 状态 ， 首 先 给 出 群体 适应 度 方差 的 
定义 ， 同 时 也 给 出 了 粒子 收敛 的 定义 。 

定义 1 设 粒子 群 的 粒子 数目 为 "， /为 第 个 粒子 的 适应 度 ，_fs 
为 粒子 群 目前 的 平均 适应 度 ，o 为 粒子 群 的 群体 适应 度 方差 ， 则 o 
可 以 定义 为 : 


PES iem d | (4-24) 


其 中 /是 归 一 化 定 标 因 子 ， 其 作用 是 限制 的 大 小 , /可 以 取 任意 
值 ， 满 足 两 个 条 件 : @ 归 一 化 后 ， 整 个 粒子 群 | 六 fs| 的 最 大 值 不 大 于 
1; @/ 随 算法 的 进化 而 变化 ,7 的 取 值 采用 如 下 公式 : 

rrt 


l, others — 
该 定义 表明 ， 群 体 适应 度 方差 反映 的 是 粒子 群 中 所 有 粒子 的 
“收敛 ”程度 。o 越 小 ， 则 粒子 群 越 趋 于 收敛 ， 反 之 ， 粒 子 群 则 处 
于 随机 搜索 阶段 。 
定义 2 设 粒 子 群 中 某 个 粒子 在 时刻 的 位 置 为 x()，p 为 搜索 空 
间 内 的 任意 位 置 ， 则 粒子 收敛 定义 如 下 (Van Den Bergh, 2002): 
Ea (4-26) 
该 定义 表明 ， 粒 子 的 收敛 是 指 粒子 最 络 停留 在 搜索 空间 内 某 一 
固定 位 置 p。 
定理 ”如 果 粒 子 群 优化 算法 陷入 早熟 收敛 或 者 达到 全 局 收敛 
粒子 群 中 的 粒子 将 聚集 在 搜索 空间 的 一 个 或 几 个 特定 位 置 ， 这 时 群 
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体 适应 度 方差 等于零 。 

该 定理 给 出 了 粒子 群 优化 算法 群体 适应 度 方差 与 收敛 状态 之 间 
的 关系 。 对 于 粒子 群 中 的 任意 粒子 ， 其 最 终 收敛 位 置 将 是 整个 粒子 
群 找到 的 全 局 极 值 。 如 果 粒 子 群 找到 的 全 局 极 值 只 有 一 个 ， 那 么 所 
有 粒子 都 会 聚集 到 该 位 置 ， 如 果 全 局 极 值 不 止 一 个 ， 那 么 粒子 将 随 
机 聚集 在 这 几 个 全 局 极 值 位 置 。 全 局 极 值 是 所 有 粒子 在 算法 运行 过 
程 中 找到 的 最 佳 粒子 位 置 ， 该 位 置 并 不 一 定 就 是 搜索 空间 中 的 全 局 
最 优点 。 因 此 仅 赁 群体 适应 度 方 差 等 于 零 不 能 区 别 早 熟 收敛 与 全 局 
收敛 ， 还 须 进 一 步 判断 算法 此 时 得 到 的 最 优 解 是 否 为 理论 全 局 最 优 
解 或 者 期 望 最 优 解 f;。 如 果 此 时 已 经 得 到 全 局 最 优 ， 则 可 认为 算法 
达到 全 局 收敛 ， 反 之 ， 则 表明 算法 陷入 局 部 最 优 。 

根据 公式 (4-22) 和 公式 (4-23)， 粒 子 下 一 时 刻 的 位 置 由 当前 位 
置 与 当前 速度 共同 决定 ， 速 度 方向 决定 粒子 前 进 方向 ， 速 度 大 小 决 
定 移动 距离 。 其 中 ， 粒 子 当前 速度 包括 3 个 因素 : 原来 的 速度 、 个 
体 极 值 ps 与 全 局 极 值 pss。 全 局 极 值 ps 是 算法 目前 找到 的 最 优 解 。 
如 果 算 法 出 现 早 熟 收 敛 ， 全 局 极 值 poy 一 定 是 局 部 最 优 解 。 结 合 公 
式 (4-22)， 如 果 此 时 通过 变异 操作 改变 全 局 极 值 psjs， 就 可 以 改变 粒 
子 的 前 进 方向 ， 从 而 让 粒子 进入 其 他 区 域 进 行 搜索 ， 在 其 后 的 搜索 
过 程 中 ， 算 法 就 可 能 发 现 新 的 个 体 极 值 py 以 及 全 局 极 值 psz。 如 此 循 
环 ， 算 法 就 可 以 找到 全 局 最 优 解 。 

考虑 到 粒子 在 当前 psg 的 作用 下 可 能 发 现 更 好 的 位 置 ， 因 此 新 算 
法 将 变异 操作 设计 为 一 个 随机 算 子 ， 即 对 满足 变异 条 件 的 psg 按 一 定 
的 概率 pw 变异 。Pw 计 算 公式 如 下 ;: 
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2 a 
"n f o <oyandf (Pya) < fa (427) 


0, others 
其 中 ，k 可 以 取 [0.1，0.3] 之 间 的 任意 值 ， 思 可 以 设置 为 理论 最 优 
值 。 这 里 考虑 的 是 分 类 精度 “最 大 化 ”情况 。 
对 于 ps 的 变异 操作 ， 将 采用 增加 随机 扰动 的 方法 ， 设 ps 为 pss 的 
第 f 维 取 值 ，w 是 服从 Gauss(0，1) 分 布 的 随机 变量 ， 则 
Drea=p'ea * (030.5 * n) (4-28) 
变异 操作 在 迭代 中 不 断 缩小 种 群 搜索 空间 ， 当 出 现 早熟 收敛 
时 ， 能 使 粒子 跳出 先前 找到 的 最 优 值 位 置 ， 在 更 大 的 空间 中 开展 新 
的 搜索 ， 同 时 变异 操作 也 保持 了 种 群 的 多 样 性 。 


423 ”土地 覆盖 分 类 模型 构建 


SVM 做 分 类 预测 时 需要 调节 相关 参数 才能 得 到 理想 的 预测 分 类 
准确 率 ， 通 常 采用 的 方法 为 交叉 验证 (CV，Cross Validation)， 主 要 
思想 是 让 惩罚 参数 、 核 函数 参数 在 一 定 的 范围 内 取 值 ， 最 终 取 使 得 
训练 集 验证 分 类 准确 率 最 高 的 那 组 作为 最 佳 参数 ， 但 有 一 个 问题 就 
是 可 能 会 有 多 组 参数 对 应 于 最 高 的 验证 分 类 准确 率 ， 此 时 便 出 现 对 
于 同时 达到 最 高 验证 分 类 准确 率 参数 的 取舍 问题 。 本 书 粒子 表示 为 
SVM 的 主要 参数 ， 在 此 将 对 训练 集 进行 CV 意义 下 的 分 类 精度 作为 
AMPSO 中 的 适应 度 函数 ， 如 公式 (4-29) 所 示 : 

gm 
cct uc 


这 里 cc 和 wc 分 别 代表 正确 样本 数 和 错 分 样本 数 。 
利用 AMPSO 对 SVM 的 参数 寻 优 ， 其 流程 如 图 4-3 所 示 。 


x100% (4-29) 
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ETT 


i 


数据 归 一 化 


训练 样本 i 测试 样本 
Y 


SVM 人 参数 最 优 解 I 


训练 样本 | | 测试 样本 
构建 分 类 模型 自 适 应 粒子 
— 群 优化 算法 
vy 
确定 适应 度 函 数 
(CV 意 义 下 的 准确 率 ) 
N 
满足 终止 条 件 
Y 
Y 
输出 最 优 解 


图 4-3 AMPSO 优 化 SVM 人 参数 的 算法 流程 图 


AMPSO-SVM 算 法 的 具体 步骤 如 下 。 

Stepl: 随机 初始 化 粒子 群 中 粒子 的 位 置 和 速度 。 

粒子 由 SVM 的 主要 参数 构成 。SVM4 种 核 函 数 中 RBF 核 具有 较 
宽 的 收敛 性 ， 不 受 维 数 以 及 样本 数量 的 严格 限制 ， 本 模型 选择 RBF 
作为 分 类 依据 函数 。 由 此 初始 化 粒子 包括 惩罚 参数 c 和 RBF 核 函 数 参 
数 y 两 部 分 。 
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Step2: 将 粒子 ps 设置 为 当前 位 置 ，Ps 设 置 为 初始 群体 中 最 佳 粒 
子 位 置 。 

Step3: 判断 算法 是 否 满足 收敛 条 件 ， 如 果 满 足 则 执行 Step9， 
否则 执行 Step4。 

粒子 群 优化 算法 最 终 达 到 收敛 位 置 时 ， 整 个 粒子 群 将 获得 全 局 
极 值 ， 利 用 群体 适应 度 方差 o*、 全 局 极 值 / (p。) 与 理论 极 值 有 比较 作为 
全 局 收敛 判定 准则 ， 将 SVM 得 到 的 分 类 准确 度 作为 粒子 的 适应 度 函 
数 ， 计 作 f， 如 公式 (4-29) 所 示 ; 收敛 条 件 为 同时 满足 公式 (4-30) 和 公 
式 (4-31): 


o= iem X =0 (4-30) 


f pe) (4-31) 

其 中 ，j 为 第 个 粒子 的 适应 度 ， 太 = 为 粒子 群 目 前 的 平均 适应 度 。 

Step4: 速度 更 新 ， 位 置 更 新 。 根 据 公式 (4-22) 和 公式 (4-23) 更 新 
速度 和 位 置 。 

Step5: 据 公 式 (4-24) 和 公式 (4-25) 计 算 群体 适应 度 方 差 ， 并 计 
Sf (p. 

Step6: 根据 公式 (4-27) 计 算 变 异 概率 pw。 

Step7: 产生 随机 数 re [0，1]， 如 果 x<p,,， 按 公式 (4-28) 执 行 变 
异 操作 ， 否 则 ， 转 向 Step8。 

Step8: 判断 Step3 收 敛 准 则 是 否 满足 ， 如 果 满 足 ， 执 行 Step9， 
否则 执行 Step4。 

Step9: 输出 p。， 算 法 结束 。 
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说 4.3 实验 结果 与 分 析 


4.3.1 实验 影像 选取 


为 了 验证 AMPSO-SVM 模 型 的 有 效 性 ， 本 文选 择 2006 年 5 月 17 
日 获取 行列 号 115-30 多 光谱 Landsat-5 TM 遥感 影像 。 由 于 幅面 有 
限 ， 图 形 比例 尺 较 小 ， 难 以 从 视觉 上 直观 反映 各 种 分 类 算法 的 性 
能 。 为 此 ， 从 研究 区 原始 TM 遥 感 影像 图 中 切割 出 典型 区 域 ， 从 微 
观 上 比较 各 类 算法 的 分 类 结果 。 图 4-4 为 研究 区 T543 假 彩色 合成 。 
实验 为 了 保持 研究 区 各 种 地 物 的 原始 光谱 特征 ， 提 高 自动 分 类 的 准 
确 性 和 科学 性 ， 影 像 未 作 数字 增强 处 理 。 此 外 ， 由 于 实验 重点 在 于 
土地 覆盖 遥感 影像 信息 提取 算法 研究 ， 所 有 影像 未 作 投影 变换 ， 仍 
采用 默认 的 UTM 投 影 。 


图 4.4 “研究 区 原始 影像 5、4、3 波 段 合成 ) 


第 4 章 SVM 参数 优化 方法 研究 | 83 | 


4.3.2 ”特征 选取 及 样本 集 表示 


特征 提取 与 特征 选择 是 模式 识别 中 的 关键 技术 之 一 。 如 第 3 章 
介绍 ， 本 文 提取 了 8 个 特征 ， 包 括 TM 图 像 的 6 个 波段 (1 一 5 波段 ，7 波 
段 )、PCA 变 换 的 第 一 主 分 量 、 植 被 指数 (NDVD。 

据 第 3 章 介绍 研究 区 土地 覆盖 分 类 系统 ， 本 章 采用 一 级 分 类 ， 
研究 区 共 分 为 5 大 类 ， 即 建筑 用 地 、 农 田 、 水 体 、 其 他 和 和 森林， 分 
别 用 类 别 代号 wo 一 os 表示 ， 从 试验 区 遥感 影像 上 应 用 简单 随机 采样 
方法 选取 共计 2 059 个 训练 样本 和 1 779 个 验证 样本 ( 详 见 表 4-1)， 用 
于 训练 分 类 算法 和 评价 分 类 精度 。 让 每 个 样本 集 、 测 试 集 独立 于 训 
练 集 。 整 个 实验 在 Intel 酷 豁 3.0 GHz CPU、 内 存 为 2GB 的 台式 计算 
机 上 进行 ， 算 法 采用 Matlab 9.0 及 ENVI4.5 软 件 编程 实现 ，SVM 采 用 
LIBSVM 工 具 。 


表 4-1 类 别 及 样本 数量 
类 别 代号 验证 样本 
o, 418 
o, 371 
Ey 237 
Os | 其他 | 367 — | 389 
| AK | 682 364 
RN | s | 209 | 179 


4.3.3” 核 函数 的 选取 


除了 公式 (4-17) 和 公式 (4-21) 介 绍 的 常用 核 函数 外 ， 还 包括 指数 
径 向 基 核 函数 、 小 波 核 函 数 、 傅 里 叶 核 函数 等 其 他 一 些 核 函数 ， 但 
应 用 相对 较 少 。 在 训练 SVM 的 过 程 中 ， 多 项 式 核 函 数 耗费 时 间 更 
多 ， 而 且 它 比 径 向 基 核 函数 有 更 多 的 参数 需要 调整 和 设置 ， 当 多 项 
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式 的 次 数 很 高 时 ， 它 可 能 趋 近 于 零 或 无 穷 m，Sigmoid 核 函数 对 某 些 
参数 的 表现 与 径 向 基 函 数 相似 ， 但 它 对 某 些 参数 是 无 效 的 pq。 许多 
前 人 的 研究 成 果 表 明 径 向 基 核 函数 比 多 项 式 核 函数 具有 更 好 的 分 类 
性 能 ， 特 别 是 当 样本 数据 量 很 大 时 ， 径 向 基 核 函数 的 收敛 性 能 强 于 
其 他 核 函 数 PP9。 


43.4 实验 参数 及 精度 评价 指标 


1. 主要 参数 

除了 AMPSO 寻 优 获 得 的 SVM 惩罚 参数 与 核 函数 参数 外 ， 分 类 
模型 还 包括 SVM 的 初始 化 参数 值 设 为 3， 种 群 规模 为 30; 最 大 和 迭代 
次 数 为 100; 学 习 因子 ci 设 为 1.6;， 学 习 因 子 cs 设 为 1.5。 

2. 精度 评价 指标 

分 类 精度 是 评价 分 类 器 性 能 的 重要 指标 ， 目 前 的 分 类 精度 
评价 方法 很 多 ， 包 括 Mapping Accuracy IndexEq，Mean Accuracy 
Index? Classification Success IndexPq 等 。 误 差 矩 阵 是 一 个 常用 的 
和 遥感 影像 分 类 精度 描述 模型 ， 本 文采 用 基于 误差 矩阵 的 总 体 分 类 
精度 、 用 户 精 度 、 生 产 精 度 及 Kappa 系 数 的 分 类 精度 评价 方法 来 评 
价 AMPSO-SVM 算 法 的 分 类 性 能 ， 分 别 表 示 如 下 PP9， 其 中 必 表 
示 分 类 数据 类 型 中 第 ;类 和 实测 数据 类 型 中 第 ;类 所 占 的 组 成 部 分 ; 


,= 六 为 分 类 所 得 到 的 第 ;美的 总 和 ， P.j = -六 为 实际 观测 的 第 
us cae 
(1) 总 体 分 类 精度 


P= Py (4-32) 
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Po 是 具有 概率 意义 的 一 个 统计 量 ， 表 述 的 是 对 每 一 个 随机 样本 
所 分 类 的 结果 与 地 面 对 应 区 域 的 实际 类 型 相 一 致 的 概率 。 
(2) 用 户 精度 (对 于 第 关 ) 
Pu 一 PalPir (4-33) 
表示 从 分 类 结果 中 任 取 一 个 随机 样本 ， 其 所 具有 的 类 型 与 地 面 
实际 类 型 相同 的 条 件 概率 。 
(3) 生产 精度 (对 于 第 /类 ) 
Pay DyP«g (4-34) 
表示 相对 于 地 面 获得 的 实际 资料 中 的 任意 一 个 随机 样本 ， 分 类 
图 上 同一 地 点 的 分 类 结果 与 其 相 一 致 的 条 件 概率 。 
(4) Kappa 系 数 
总 体 精度 、 用 户 精 度 和 制图 精度 从 不 同 的 侧面 反映 了 分 类 精度 
的 统计 估计 ，Kappa 系 数 分 析 采 用 了 另 一 种 离散 的 多 元 技术 ， 是 一 
种 用 来 测定 两 幅 图 之 间 吻 合 度 或 精度 的 指标 。 其 公式 表达 如 下 "1; 
NYx, -F x) 


Kappa = —= 


7 (4-35) 
N?- Sea 


4.3.5 ”实验 结果 与 比较 


第 一 个 试验 是 比较 SVM 的 Sigmoid 核 函数 和 径 向 基 核 (Radial 
Basis Function) 分 类 性 能 。 以 SVM-Sigmoid 和 SVM-RBF 分 类 器 ， 
在 固定 参数 c=100，y=0.143 条 件 下 对 待 分 类 遥感 数字 集 (如 表 4-2) 
进行 分 类 ， 并 与 传统 最 大 似 然 法 (Maximum Likelihood) 在 生产 精 
度 、 用 户 精度 、 总 精度 ， 以 及 Kappa 系 数 评价 指标 下 进行 比较 ， 


| 86 | 基于 机 器 学 习 的 遥感 影像 分 类 方法 研究 


其 结果 如 表 4-2 所 示 。 首 先 ， 使 用 SVM 方法 分 类 的 精度 明显 高 于 
Maximum Likelihood 方 法 ， 其 中 SVM-Sigmoid 方 法 得 到 的 总 分 类 精 
度 比 Maximum Likelihood 高 出 0.68%， 而 SVM-RBF 方 法 得 到 的 分 类 
精度 比 Maximum Likelihood 高 出 3.15%，SVM-RBF 方 法 得 到 的 Kappa 
系数 分 别 比 SVM-Sigmoid 方 法 和 Maximum Likelihood 高 出 0.031 4 和 
0.039 8。 因 此 ， 可 以 得 出 SVM-RBF 方 法 的 分 类 性 能 最 优 ， 本 文采 
用 RBF 核 函数 。 

第 二 个 实验 采用 传统 PSO 和 AMPSO 优 化 算法 对 SVM 的 c 和 ?) 寻 
优 。 图 4-5 和 图 4-6 分 别 为 两 种 优化 算法 获得 的 适应 度 曲线 (以 分 类 精 
度 为 适应 度 函数 )。 从 结果 中 可 以 看 出 ， 带 变异 算 子 的 粒子 群 优化 算 
法 能 够 及 时 跳出 局 部 极 小 值 ， 收 敛 效果 更 优 。 同 时 表 4-3 列 出 两 个 分 
类 模型 所 获得 的 最 优 c 和 y 参 数值 ， 以 及 总 精度 和 Kappa 系 数 ， 其 中 
由 PSO-SVM 分 类 模型 所 得 到 c 和 ) 的 值 为 166.942 3 和 1.366; AMPSO-SVM 
分 类 模型 所 得 到 c 和 ?的 值 246.789 1 和 0.134， 总 精度 从 PSO-SVM 的 
91.50% 提 高 到 AMPSO-SVM 的 93.59%，Kappa 系 数 由 0.890 3 提高 为 
0.9175， 结 果 明显 优 于 SVM 的 手工 设置 值 100 和 0.143 所 得 到 的 结 
果 ， 这 些 均 表明 AMPSO-SVM 模 型 能 够 有 效 提高 遥感 影像 的 分 类 
精度 。 


表 4-2 不 同 分 类 器 分 类 精度 比较 
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适应 度 曲 线 (参数 c1=1.6，c2=1.5， 终止 代数 =100) 


0 10 20 30 40 50 60 70 80 90 100 
进化 代数 
图 4-5 PSO-SVM 适 应 度 曲线 


s 适应 度 曲线 (参数 cl1=1.6，c2=1.5， 终 止 代 数 =100) 


95 + 


90 上 


适应 度 


85 上 


80 上 


75 


0 10 20 30 40 50 60 70 80 90 100 
进化 代数 
图 4-6 AMPSO-SVM 适 应 度 曲线 


| 88 | 基于 机 器 学 习 的 遥感 影像 分 类 方法 研究 


试验 最 后 将 所 提出 AMPSO-SVM 模 型 应 用 于 研究 区 土地 覆盖 分 
类 试验 。 为 了 比较 其 分 类 性 能 ， 分 别 与 Maximum Likelihood 法 、 传 
统 SVM 分 类 法 、PSO-SVM 分 类 法 对 比 。 分 类 结果 如 图 4-7 所 示 ， 其 
中 图 4-7(a) 为 最 大 似 然 法 分 类 结果 ， 分 类 后 获取 的 地 类 斑 块 破碎 化 
程度 大 ， 零 碎 地 类 斑 块 多 ， 存 在 严重 的 森林 与 植被 的 混 分 现象 ， 图 
4-7(b) 采 用 传统 SVM 分 类 方法 对 影像 的 分 类 结果 ， 图 4-7(c) 和 (d) 分 别 
采用 PSO-SVM 和 AMPSO-SVM 方 法 的 分 类 结果 ， 从 图 中 可 以 直观 的 
看 出 图 4-7(d) 的 分 类 效果 明显 好 于 其 他 3 种 方法 ， 尤 其 是 针对 森林 和 
耕地 的 区 分 。 

表 4-3 ”三 种 分 类 方法 参数 及 分 类 精度 、Kappa 系 数 比较 
分 类 模型 Kappa 系 数 


PSO-SVM | 1669423 | 1366 0.890 3 
AMPSO-SVM | 246.789 1 0.134 09175 


(a) Maximum Likelihood 分 类 结果 


图 4-7 ”四 种 分 类 方法 的 分 类 结果 
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(c) PSO-SVM 分 类 结果 


图 4-7 ”四 种 分 类 方法 的 分 类 结果 ( 续 ) 
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(d) AMPSO-SVM 分 类 结果 


Bese Beco 国 水 国共 他 Baer 
图 4-7 ”四 种 分 类 方法 的 分 类 结果 ( 续 ) 


8$4.4 ”本章 小 结 


AMET MEAP SOMES VM BALE CE PAI SK, JE HAI AR 
率 不 高 从 而 造成 参数 寻 优 不 准确 的 缺点 ， 提 出 了 一 种 基于 自 适应 变 
异 粒子 群 算法 的 SVM 参 数 优化 模型 (AMPSO-SVM)。 自 适应 粒子 群 
优化 算法 是 以 粒子 群 的 群体 适应 度 方差 s 和 全 局 极 值 与 理论 最 优 值 
的 比较 作为 粒子 群 优化 算法 是 否 陷入 局 部 极 值 的 评价 指标 ， 引 入 
变异 算 子 使 得 算法 能 够 及 时 跳出 局 部 极 值 进而 获得 全 局 最 优 解 。 
AMPSO-SVM 能 够 克服 传统 SVM 分 类 模型 参数 选择 的 主观 性 ， 同 时 
可 以 快速 摆脱 局 部 搜索 的 束缚 ， 实 验 表明 ， 该 模型 能 有 效 提高 遥感 
影像 分 类 的 精度 。 
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5.1 概述 


遥感 信息 是 地 球 表面 地 物 的 综合 反映 ， 地 物种 类 繁多 且 地 物 之 
间 存 在 界限 的 模糊 性 和 重 又 性 趾 ， 由 此 造成 蜗 感 信息 具有 很 强 的 不 
确定 性 。 模 糊 集 理 论 是 处 理 这 种 不 确定 数据 的 有 力 工具 中， 许多 
基于 模糊 统计 学 的 算法 被 应 用 于 遥感 图 像 处 理 中 中外。 此 外 ， 在 遥 
感 影像 分 类 过 程 中 人 为 选择 样本 少 且 代表 性 不 好 ， 也 是 影响 分 类 精 
度 的 又 一 关键 问题 。 

半 监 督学 习 是 在 较 少 的 训练 标签 样本 的 基础 上 ， 同 时 利用 大 
量 、 廉 价 的 未 标记 样本 ， 通 过 挖掘 未 标记 样本 中 所 殖 涵 的 各 待 分 类 
类 型 在 特征 空间 中 的 固有 结构 信息 ， 来 对 已 标记 样本 可 能 因 代表 性 
不 好 而 造成 的 拟 合 分 类 器 有 偏差 情况 进行 娇 正 " 外 。 如 果 能 把 大 量 无 
标签 样本 所 包含 的 数据 特征 加 入 到 学 习 算 法 的 设计 中 ， 就 可 以 弥补 
单个 监督 分 类 器 的 不 足 ， 获 得 更 好 的 分 类 效果 。 

本 章 一 方面 利用 自 训练 半 监督 学 习 算法 与 第 4 章 介绍 优化 的 SVM 
结合 构建 半 监督 分 类 模型 ， 另 一 方面 在 自 训 练 算法 的 未 标记 样本 标注 
过 程 中 ， 利 用 模糊 聚 类 理论 ， 比 较 3 种 可 靠 无 标签 样本 标注 方法 ， 主 要 
目的 在 于 控制 错误 类 别 样本 的 标注 ， 进 而 提高 分 类 器 的 分 类 精度 。 


55.2 日 训练 半 监 督学 习 


5.2.1 无 标签 样本 的 重要 性 


半 监 督学 习 的 基本 设置 是 给 定 一 个 来 自 某 一 未 知 分 布 的 有 标记 
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EARL Ep Ys Qus Ys» ct» Que Yap URAC BI 
U= xus ors xop SSE ARR: X 一 了 可 以 准确 地 对 
样 例 x 预 测 其 标记 ?中 。 
Miller 和 UyarG9o 从 数据 分 布 估计 的 角度 给 出 了 一 个 直观 的 分 
析 ， 假 设 所 有 数据 服从 某 个 由 LZ 个 高 斯 分 布 混合 而 成 的 分 布 : 
/C10 Ya fol) (5-1) 
sth, Xa -DyiRA AG 0-(0) 为 参数 。 标 记 可 视 为 一 个 由 
选 定 的 混合 成 分 mm 和 特征 向 量 x 以 概率 Plcls，m) 决 定 的 随机 变量 。 
于 是 ， 根 据 最 大 后 验 概率 假设 ， 最 优 分 类 由 以 下 公式 给 出 
h(x) = ii? 2 Pe, =k|m,=j, x)PQn, = j|x) 62) 
这 样 ， 学 习 目 标 就 变 成 了 利用 训练 样 例 来 估计 Peklmj=j，x) 
和 P(mzjlw)。 这 两 项 中 的 第 一 项 与 类 别 标 记 有 关 ， 而 第 二 项 并 不 依 
赖 于 样 例 的 标记 ， 如 果 有 大 量 的 无 标记 样 例 可 用 ， 则 意味 着 能 够 用 
于 估计 第 二 项 的 样 例 数 显著 增多 ， 这 会 使 得 第 二 项 的 估计 变 得 更 加 
准确 ， 从 而 导致 公式 (5-2) 更 加 准确 。 也 就 是 说 ， 分 类 器 的 泛 化 能 力 
得 以 提高 。 因 此 ， 无 标记 样 例 的 价值 就 在 于 它们 能 够 帮助 更 好 地 估 
计 模 型 参数 ， 从 而 提高 模型 性 能 。 


522 自 训 练 半 监 督 算法 


自 训练 方法 是 半 监 督学 习 比 较 常 用 的 方法 ， 有 时 也 称 为 self- 
teaching， 被 广泛 应 用 于 物体 监测 路、 自然 语言 处 理 中 ， 以 及 遥 
感 影像 分 类 中 。 自 训练 方法 首先 用 有 标签 样本 训练 一 个 分 类 器 ， 然 
后 用 此 分 类 器 对 所 有 无 标签 样本 进行 分 类 ， 并 给 每 个 无 标签 样本 标 
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上 类 别 标签 和 相应 的 置信 度 ; 再 将 置信 度 高 的 样本 连同 它 的 类 别 标签 
合并 到 训练 集中 继续 训练 分 类 器 ; 重复 上 述 过 程 直至 结束 条 件 满 足 。 


| | sumet < 


Jl 算法 重复 直至 
满足 结束 条 件 


| | 初始 分 类 器 估计 无 标签 样 本 标签 类别 


y 


定义 标签 置信 度 的 选择 标准 


二 一 加 入 到 初始 标签 样本 集 
将 符合 标准 的 已 标注 样本 


图 5-1 自 训练 半 监 督 算法 


设 已 标注 样本 集合 L， 未 标注 样本 集合 为 M， 类 别 数 为 C， 自 训 
练 算法 流程 如 下 。 

Stepl: 从 未 标注 样本 集 M 中 随机 选 出 N 个 未 标注 样本 组 成 未 标 
TERRA 

Step2: 迭代 。 

(1) 利用 已 标注 样本 集合 Z 训 练 得 到 初始 分 类 器 ; 

(2) 利用 初始 分 类 器 对 未 标注 样本 池 M 进 行 标注 ; 

G) 从 标注 样本 池 ?M 中 选 出 标注 置信 度 大 于 阔 值 的 样本 加 入 到 
标注 样本 训练 集 Z， 

(4) 从 未 标注 样本 集 M 中 随机 选 出 X 个 未 标注 样本 组 成 新 的 未 标 
注 样本 池 M 。 
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Step3: 退出 。 

M 是 否 为 空 或 者 是 否 满足 其 他 退出 条 件 ， 若 不 为 空 且 不 满足 其 
他 退出 条 件 ， 返 回 Step2(1)， 否 则 退出 。 

从 Self-training 算 法 不 难看 出 : 在 初始 阶段 ， 只 利用 少量 标注 样 
本 进行 训练 学 习 得 到 初始 分 类 器 ， 然 后 利用 得 到 的 初始 分 类 器 对 大 
量 未 标注 样本 进行 标注 ， 也 就 是 分 类 器 是 用 自己 的 预测 自我 学 习 ， 
那么 如 果 某 个 分 类 器 训练 数据 集中 加 入 一 个 错误 的 分 类 信息 时 ， 所 
得 到 的 分 类 结果 也 可 能 由 于 预测 错误 而 不 断 加 强 "9， 进 而 扩大 分 类 
器 的 错误 分 类 ， 这 就 是 所 谓 的 “错误 累积 ”现象 。 


5.3 ”模糊 聚 类 理论 


聚 类 假设 (Cluster Assumption) 是 半 监 督学 习 中 的 基本 假设 。 它 
指出 处 在 相同 艇 (cluster) 中 的 样 例 有 较 大 的 可 能 属于 同一 类 。 


5.3.1 REB SES: 


Jainrq 在 1988 年 关于 聚 类 所 下 的 定义 : 一 个 类 簇 内 的 实体 是 相 
似 的 ， 不 同类 簇 的 实体 是 不 相似 的 ， 一 个 类 簇 是 测试 空间 中 点 的 会 
聚 ， 同 一 类 簇 的 任意 两 个 点 间 的 距离 小 于 不 同类 簇 的 任意 两 个 点 间 
的 距离 ， 类 簇 可 以 描述 为 一 个 包含 密度 相对 较 高 点 集 的 多 维 空间 中 
的 连通 区 域 ， 它 们 借助 包含 密度 相对 较 低 点 集 的 区 域 与 其 他 区 域 (类 
簇 ) 相 分 离 。 事 实 上 ， 聚 类 是 一 个 无 监督 的 分 类 ， 它 没有 任何 先 验 知 
识 可 用 。 
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聚 类 的 形式 描述 如 下 "1; 
4U-(p,s po ce Py} BARMERA p; 表 示 第 ;个 
B0, 2, n}; CSU; rl, 2, +) k; CH Py» Dy ons 
Pa} proximity(pms，ps)， 其 中 第 一 个 下 标 表示 模式 所 属 的 类 ， 第 二 
个 下 标 表示 某 类 中 某 一 模式 ， 函 数 proximiiy 用 来 刻画 模式 的 相似 性 
距离 。 若 类 C 为 聚 类 的 结果 ， 则 C 满 足 如 下 条 件 : 
UGC- (5-3) 
WFVC,, CSU, C,Z£C, fi: 
C, C=O (SRF RIERA) 
MIN pm ec, vpwec,’ YCp GEURC c (PPOXIMILY Pur Pr))> 
MAXyp, s pvecy YCE PTOXIMIY Pm Puy) (5-4) 
典型 的 聚 类 过 程 主要 包括 数据 (或 称 样本 或 模式 ) 准 备 、 特 征 选 
择 和 特征 提取 、 接 近 度 计算 、 聚 类 (或 分 组 )、 对 聚 类 结果 进行 有 效 
FEVER AR Ip guo 0n, 


5.3.2 ”常用 聚 类 算法 

1.K- 均 值 聚 类 

K- 均 值 K-means) 是 一 种 非 监督 学 习 算 法 ， 由 MacQueenE 提 
出 ， 用 于 将 给 定 的 样本 集 分 成 指定 数目 的 聚 类 。K-means 的 聚 类 准 
则 是 使 每 一 类 中 多 模式 点 到 该 类 别 中 心 距离 的 平方 和 最 小 。 


K K N 2 
J= 24, Ex -CG (5-5) 
= ic je 


其 中 ，. 为 第 ;类 聚 类 的 目标 函数 ; 天 为 聚 类 个 数 ， 马 为 第 /个 输 
入 向 量 ; C 为 第 ; 企 聚 类 中 心 (向 量 )，w% 为 权重 (隶属 度 矩 阵 )。 
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首先 ， 选 择 k 个 初始 质心 ， 每 个 点 指派 到 最 相近 的 质心 ， 而 指 
派 到 一 个 质心 的 点 集 为 一 个 簇 。 然 后 ， 根 据 指派 到 簇 的 点 ， 更 新 每 
个 簇 的 质心 。 重 复 指派 和 更 新 步骤 ， 直 到 簇 不 发 生变 化 ， 或 等 价 
地 ， 直 到 质心 不 发 生变 化 。 

K-means 算 法 的 步骤 如 下 。 

Step]: BÉNLXEBUCT ÉRIC, il. 2, 0e k; 并 将 之 分 别 视 
为 各 聚 类 的 初始 中 心 。 

Step2: 决定 各 数据 点 所 属 的 聚 类 ， 若 数据 点 已 判定 属于 第 ; 聚 
类 ， 则 权重 值 w=1， 否 则 为 0。 


w -fe ifl -el-e 
^ |0; otherwise 


Vm*j 
> m d (5-6) 


HWE: 

Sw =]; vj =1, 2, =, n; Sie (5-7) 
Step3: 计算 目标 函数 7/， 如 果 ./ 保 持 不 变 ， 代 表 聚 类 结果 已 经 稳 

定 不 变 ， 则 可 结束 此 和 欠 代 方法 ;否则 进入 Step4。 


Step4: 更 新 聚 类 的 中 心 点 ， 回 到 Step2。 
C, 2 — (5-8) 


K-means 算 法 是 一 种 硬 分 类 方法 ， 它 把 每 个 待 辨识 的 对 象 严格 
地 划分 到 某 个 类 中 ， 具 有 非 此 即 彼 的 性 质 。 而 实际 上 遥感 数据 所 反 
映 的 大 多 数 地 物 覆 盖 在 形态 和 类 别 方面 存在 着 中 介 性 ， 没 有 确定 的 
边界 来 区 分 它们 。 因 此 ， 需 要 考虑 各 个 像 元 属于 各 个 类 别 的 隶属 度 
问题 ， 对 部 分 混合 像 元 进行 软 划分 ， 才 能 更 好 地 区 分 不 同 的 地 物 
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HY", 

2. 模糊 c-means 算法 

模糊 c-means(FCMclusb) 算 法 局 的 目标 函数 定义 如 同 K-means 聚 
类 算法 ， 但 其 权重 矩阵 不 再 是 二 元 和 矩阵， 而 是 应 用 了 模糊 理论 的 
概念 ， 使 得 每 一 输入 向 量 不 再 仅 归 属于 某 一 特定 的 聚 类 ， 而 以 其 归 
属 程度 来 表现 属于 各 聚 类 的 程度 。 

目标 函数 .为 : 

J- i. - XO» -cl (5-9) 

其 中 ， 马 为 数据 点 ; CARR; NABER, KARK 
中 心 点 个 数 ，m 为 权重 指数 ，w; 为 权重 (隶属 度 矩 阵 )。 

FCMclust 算 法 的 步骤 如 下 。 

Step1: 设 定 分 类 个 数 [ 及 初始 权重 矩阵 ， 随 机 给 定 0 一 1 之 值 ， 
并 满足 权重 总 和 为 1， 公 式 如 下 。 

Ss edi Vw, €[0, 1]; 21, 2, =, N; 0«Y w,«N (5-10) 


Step2: 计算 聚 类 中 心 点 。 
Gu G-11) 


Step3: 计算 目标 函数 值 ， 当 目标 函数 值 小 于 设 定 的 容忍 误差 可 
结束 迭代 过 程 ， 否 则 执行 Step4。 
E(ty-4J9-J* Ike (5-12) 
Step4: 重新 计算 权重 矩阵 w， 并 回 到 Step2 进 行 运算 。 
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1 


3 6-13) 


Ix, =C, 


s=1 


比 之 脆弱 或 硬 分 割 方法 ，FCMclust 能 够 保留 初始 图 像 的 更 多 
信息 。 然 而 ，FCMclust 的 一 个 缺点 是 不 考虑 图 像 上 下 文中 的 任何 
空间 信息 ， 这 使 得 它 对 噪声 和 其 他 人 造 图 像 非常 敏感 。 另 外 ， 由 于 
采用 平方 误差 和 准则 ， 该 方法 仅 适 合 于 发 现 球形 或 类 似 球形 分 布 
的 类 别 ， 而 大 多 数 多 光谱 和 遥感 图 像 的 散 点 图 趋 于 椭 球 体 分 布 号 。 因 
此 ， 一 些 学 者 在 FCM 算 法 的 基础 上 ， 通 过 修改 准则 函数 ， 达 到 对 
不 同形 状 分 布 样本 的 聚 类 F5 ~P9， 例 如 适合 椭 球 形 分 布 样本 聚 类 的 
Gustafson-Kessel 算 法 。 

3. 模糊 Gustafson-Kessel 聚 类 算法 

Gustafson-Kessel(GKclust) 算 法 是 距离 自 适应 动态 聚 类 算法 
(Adaptive Distance Dynamic Clustering Algorithm) 的 模糊 推广 ， 它 可 
以 有 效 地 搜索 超 椭 球 、 平 面 或 线 型 的 数据 类 中 1。 在 GKclust 算 法 中 ， 
n 维 数据 空间 中 点 x 到 聚 类 中 心 v 的 距离 是 一 个 平方 内 积 距 离 范 数 : 

D m= Er v) Mev); 1Si<c, 1<k<N (5-14) 

其 中 ，MFdet(CD FF， 瓦 是 第 从 聚 类 中 心 的 协 方差 矩阵 ， 为 正 
定 对 称 和 矩阵 。 将 数据 集 {fza，z，…，x 才 划分 为 c 个 模糊 类 是 通过 最 
小 化 目标 函数 来 完成 的 。 公 式 如 下 : 


c N 
JQGU,V) Y 3 a)" |x |, (5-15) 
i=l k=l 
其 中 ，[ 玛 [四 是 数据 集 的 模糊 划分 矩阵 ， 且 满足 : 


S us i; I €KXN, u, €[0, 1] (5-16) 


i=l 
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mE[1，%] 为 一 个 加 权 指 数 ， 决 定 着 所 有 分 类 的 模糊 程度 。 
Lagrange 乘 子 和 可 以 将 目标 函数 式 (5-15) 及 其 约束 式 (5-16) 转 化 为 新 
的 目标 函数 式 (5-17): 


c N N c 
JQG U, V, 2) 2 Y. Y Un)" D, + 3 AD) us - 1] (5-17) 
k=l i=! 


isl k=l 
设 D3iog>0，Vi，k 及 m>1， 另 J 关于 U，V 和 2 的 梯度 为 0， 则 可 求 
得 使 式 (5-15) 取 极 小 值 的 两 个 必要 条 件 : 
1 


k= 5 ; INiSc, ISKkSN pg, 
ü 27 Pas, 2%)! Dav (9-18) 
N 
Yu x 
y, 2 £L — —; 1<i<c (5-19) 
Yu 
ka 


给 定数 据 集 {x 三 1， gy s Ny, 选择 分 类 数目 1<c<N， 加 权 指 
数 m>1 和 终止 容许 误差 s>0。 随 机 初始 化 模糊 划分 矩阵 ww， 并 使 之 满 
足 式 (5-16)， 设 1 为 迭代 次 数 ， 算 法 步骤 如 下 。 

Step]: 计算 聚 类 中 心 点 。 
i Lun x 


y= 


Yay") 
Step2: 计算 类 协 方差 矩阵 。 


; 1<i<c (5-20) 


N 
I ü 1 
2 0 y" Qs Py, - vi?) 
F, — k=l 


N 
Xe» 
i 

k=l 


; 1Si<c (5-21) 


Step3: 计算 距离 。 
Mydet(F)"F;! (5-22) 
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Dimi = -VPY M(x -v? ); IXiXe, 1SkSN — (523) 


Step4: S BEER 4 XB RE o 


1 
(D » ]jx E E 
Hk I um ]IXiXc, IKk SN 5-24 
YS Day CoV) D, Gu v PO T" 


Step5: 判别 迭代 条 件 。 
如 果 满 足下 式 : 

120-CCall<e (5-25) 
结束 迭代 过 程 。 


5.3.3 REA MEME 


评价 聚 类 结果 优 劣 的 过 程 ， 称 为 聚 类 的 有 效 性 验证 。 一 般 来 
讲 ， 使 类 内 距离 极 小 化 而 类 间距 离 最 大 化 的 聚 类 是 最 优 聚 类 。 如 下 
给 出 不 同 的 有 效 评 估 方 法 来 判别 不 同 算法 的 聚 类 效果 。 其 中 以 N 代 
表 数 据 个 数 ，c 代 表 聚 类 个 数 ，c; 代 表 第 个 聚 类 ，v 代 表 第 个 聚 类 的 
中 心 点 ， 志 表示 点 属于 oc 的 隶属 度 。 

1. 划分 系数 PCE 

Bezdek 对 模糊 聚 类 设计 划分 系数 (Partition Coeficient) 定 义 如 下 : 


c N 
PC()- x 33-0 (5-26) 
i=l j=l 


该 系数 用 于 评判 分 类 簇 之 间 的 分 离 程度 。 在 分 类 簇 数 目 相 同 的 
情况 下 ，PC 值 越 接近 1， 分 类 效果 越 好 。 其 缺点 在 于 该 指标 值 和 隶 
属 度 有 关 ， 和 数据 的 其 他 属性 缺乏 联系 ， 并 随 c 的 增加 单调 下 降 。 

2. CE. 

4) 3l CE (Classification Entropy) Xa F: 


CE(c) = log(u,) (5-27) 
iA jal 
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用 于 计算 分 类 簇 的 模糊 度 。 在 分 类 簇 数 目 相同 的 情况 下 ，CE 值 
越 小 ， 分 类 效果 越 好 。 
3. Xie and Beni's Index Jibi xa?! 
反应 分 类 簇 内 的 紧 致 性 和 分 类 簇 间 的 分 离 性 。 其 定义 如 下 : 
o- Damas) be nl 
N min, ll, -v| 


CEDAR A ATP XBR), ARBRE 


XB (5-28) 


8$5.4 一 种 新 的 自 训 练 半 监 督 支持 癌 
量 机 分 类 模型 构建 


为 了 克服 自 训练 半 监 算法 “错误 累积 ”不 足 ， 本 书 提出 了 一 种 
新 的 自 训练 半 监 督 支持 向 量 机 分 类 模型 (简称 PSVM)， 主 要 有 如 下 
特点 : 

首先 ， 从 分 类 器 的 构造 角度 ， 利 用 第 4 章 介绍 的 自 适应 变异 粒 
子 群 算法 (AMPSO) 优 化 SVM 分 类 器 参数 构建 AMPSO-SVM( 以 下 简 
称 PSVM) 分 类 模型 作为 基 分 类 器 ， 使 用 PSVM 对 可 靠 未 标注 样本 集 
合 中 的 元 素 进行 反复 迭代 ， 扩 大 标记 样本 数目 。 

其 次 ， 未 标记 样本 池 选 择 过 程 中 ， 引 入 模糊 聚 类 算法 对 未 标签 
样本 产生 模糊 隶属 度 函 数 ， 利 用 模糊 隶属 度 函 数 将 最 接近 样本 的 有 
效 无 标签 样本 作为 标注 对 象 ， 远 离 标签 的 无 效 样本 值 ， 以 控制 错误 
信息 的 输入 。 
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5.4.1 未 标记 样本 的 选择 依据 


PS3VM 模 型 首先 利用 初始 训练 集训 练 PSVM 得 到 初始 分 类 器 ， 
采用 Gkclust 模 糊 聚 类 算法 对 未 标记 样本 进行 模糊 聚 类 产生 模糊 隶属 
度 u;， 然 后 根据 如 下 公式 选择 高 于 的 作为 未 标签 样本 的 候选 集合 ， 
进而 使 分 类 间隔 最 优化 ， 如 图 5-2 所 示 。 


5- 立 4/ (5-29) 
i=l 


*o 
9 © 
e o *o 
V? | P PS3VM classification » °o m 
? a | 9 " — s e. 
i ee 
e | 9 * o 
. o oe 
e! e 


图 5-2 PS3VM 分 类 


ik: 图 5-2 中 ， 黑 色 和 白色 圆圈 分 别 代表 标签 样本 。 左 侧 代 表 只 有 标 
签 样本 参与 分 类 时 的 分 类 间隔 (虚线 );， 右 侧 表 示 标 签 样本 与 新 标签 样本 ( 灰 
色 圆 圈 ) 共 同 参与 分 类 时 的 分 类 间隔 ( 实 线 )。 


5.4.2 ”基于 GKclust 的 自 训 练 半 监督 支持 向 量 机 
设计 流程 


为 了 更 清楚 地 说 明 所 提出 的 学 习 技术 ， 有 必要 对 如 下 概念 进行 
说 明 。 

标签 样本 集 : L-(L,o Lo c Ly 

无 标签 样本 集 : M={M,, My, ors Ms 

当前 新 样本 集 : 7={TI， 了 ，…，7Th}， 即 初始 样本 集合 与 新 标 
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签 样本 集合 的 并 集 ; 

聚 类 中 心 点 集 : Vai» Vus or Vode 

PS3VM 分 类 模型 首先 利用 Gkclust 模 糊 聚 类 算法 对 初始 标签 样本 
点 7 进行 非 监督 聚 类 产生 c 个 类 别 的 聚 类 中 心 7， 然 后 以 7 为 初始 聚 类 
中 心 ， 利 用 Gkclust 对 无 标签 样本 点 M 进 行 非 监 督 聚 类 产生 c 个 类 艇 和 
所 有 无 标签 样本 点 的 模糊 隶属 度 函 数 k;， 在 各 个 类 簇 中 ， 将 距离 聚 
类 中 心 较 近 的 点 (高 于 加) 作为 未 标签 样本 的 候选 集合 N; 利用 PSVM 
模型 ， 同 时 设 定 一 个 阐 值 对 候选 集 进 行 样本 标注 形成 集合 wy， 接 下 
来 将 y 增 加 到 Zz 中 ， 并 在 M 中 将 y 删 除 ， 如 此 连 代 ， 直 至 M 为 空 ， 流 
程 图 如 5-3 所 示 。 


图 5-3 PS3VM 分 类 模型 算法 流程 


第 5 章 ”基于 模糊 聚 类 的 半 监 督 支持 向 量 机 土地 覆盖 分 类 方法 研究 |109| 


543 ”基于 GKclust 的 自 训 练 半 监 督 支持 向 量 机 算法 


Stepl: 初始 化 标签 样本 集 7=L， 无 标签 样本 集 M，to; 

Step2: 当 M 关 中 执行 如 下 操作 ; 

Step3: 利用 标签 集训 练 SVM， 并 利用 AMPSO 进 行 参数 优化 ， 
构建 初始 分 类 器 ; 

Step4: 在 集合 7 中 利用 Gkclust 模 糊 聚 类 算法 根据 公式 (5-19) 产 
E Rp V; 

Steps: 以 为 初始 聚 类 中 心 ， 在 无 标签 集合 中 根据 公式 (5-18) 
产生 无 标签 样本 的 模糊 隶属 度 函 数值 ; 

Step6: 将 隶属 度 高 (高 于 切 ) 的 样本 点 组 成 候选 集合 N; 

Step7: 利用 PSVM 对 进行 标注 ; 

Step8: 基于 td 产生 标签 子 集 yy; 

Step9: 更 新 标签 集 T-— TU y, 

Step10: 更 新 无 标签 集 M-—M-vy; 

Stepll: 如 果 ‰ 交 中 ， 降 低 z 的 值 ; 

Step12: 判断 循环 是 否 结束 ; 

Step13: 利用 7 再 次 训练 PSVM。 


885.5 ”实验 结果 与 分 析 


在 本 节 中 ， 为 了 评价 所 提 算 法 的 性 能 ， 首 先 将 研究 区 Landsat-5 
TM 遥感 数字 化 ， 然 后 分 别针 对 TM 数字 数据 和 TM 影像 数据 进行 分 类 
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实验 。 在 第 一 个 试验 里 ，Gkclust 聚 类 算法 与 其 他 相关 算法 ， 如 名 zzy 
c-means(EFCMclusD 和 K-means， 在 聚 类 有 效 指数 、 聚 类 精度 方面 进行 
比较 ; 评价 在 半 监 督学 习 过 程 中 ， 无 标签 样本 的 加 入 数量 与 分 类 精度 
的 关系 ， 以 及 分 类 参数 的 变化 情况 。 第 二 个 实验 ， 利 用 无 标签 样本 与 
标签 样本 的 合理 比例 、 最 优 分 类 参数 构建 优化 模型 ， 并 将 其 应 用 于 影 
像 集 的 分 类 实验 。 


5.5.1 遥感 影像 数字 化 


本 文选 择 2009 年 9 月 30 日 获取 行列 号 115-30 多 光谱 Landsat-5 TM 
遥感 影像 (30 米 空 间 分 辩 率 ，UTM 投 影 )。 根 据 第 3 章 的 介绍 ， 本 试 
验 数字 影像 包括 8 个 特征 ， 分 别 是 TM 图 像 的 6 个 波段 (1 一 5，7)、 
PCA 的 第 一 主 分 量 、 植 被 指数 (NDVI)。 实 验 区 按 第 3 章 介绍 的 二 级 
分 类 系统 分 为 6 个 土地 利用 类 型 ， 即 落叶 针 叶 林 (DCF)、 常 绿 针 叶 
林 (ECF)、 落 叶 阔 叶 林 (DBLF)、 早 地 (FL)、 居 住地 (RL)、 内 陆 水 体 
(WT)。 为 了 保证 每 个 类 别 数据 的 变化 性 和 代表 性 ， 数 字 集 采 用 随机 
像素 的 选择 策略 四。 然后 将 数字 集 分 成 两 个 子 集 ， 一 部 分 用 于 训练 ， 
另 一 部 分 用 于 测试 。 具 体 的 土地 覆盖 类 型 及 训练 样本 、 测 试 样本 的 数 
量 如 表 5-1 所 示 ， 图 5-4 显 示 了 1 874 个 样本 点 的 分 布 情况 。 

表 5-1 类 别 及 样本 数量 
测试 集 数量 
149 
151 


234 
102 


* 
Ti 
" 
yi 
E: 
AW 
Jk 
$ 
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( 续 表 ) 
类 别 缩 测试 集 数 量 
DBLF 217 
WT 127 
6 980 
14 
1.2} F 
+ + 
Lp tet ] 
0.8 Hs J 
+ 
0.6 + | 
0.4 | 
0.2 4 
0 * DCF 
FL 
-0.2 * RL 
^ ECF 
-04r D diii: DBLF 
E 1 1 1 1 1 « WT 


.6 
Li 08 06 04 02 0 02 04 06 08 1 
图 5-4 1 874 个 样本 点 的 分 布 情况 


552 ”参数 设置 


为 了 达到 较 好 的 收敛 ， 参 数 c 和 ?的 取 值 范围 分 别 为 [0.1，100] 和 
[0.01，1 000]， 其 他 相关 参数 如 表 5-2 所 示 ， 此 外 ， 阔 值 z 的 初始 值 
为 0.7。 


表 5-2 参数 取 值 
Coefficient Values 
€ 15 
€; Ly 
maxgen 200 
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( 续 表 ) 
Coefficient Values 
sizepop 20 
cmax 100 
cmin 0.1 
ymax 1000 
ymin 0.01 


5.5.3 ”模糊 聚 类 算法 的 比较 


为 了 达到 比较 的 目的 ， 本 书 分 别 用 GKclust、FCMclust、 
K-means 模 糊 算法 针对 同一 训练 集 进行 聚 类 ， 并 将 聚 类 结果 在 聚 类 
有 效 性 指数 (划分 系数 PC、 分 类 业 CE、XB 指 标 ) 和 聚 类 精度 等 方面 
进行 比较 ， 如 图 5-5 所 示 。 其 中 ， 图 5-5(a) 为 894 训 练 样本 点 的 分 布 情 
况 ， 图 5-5(@) 一 (四 分别 为 3 种 算法 对 894 训 练 样本 的 聚 类 结果 。 


T Scatter plot of the 894 training samples 


12 

1t 
0.8 上 
0.6 上 


-1 -0.5 0 0.5 1 15 
(a) 894 个 样本 点 分 布 


图 5-5 ”模糊 聚 类 算法 的 比较 
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K-means clustering algorithms 


-0.6 1 L L 上 
-1 -0.5 0 0.5 1 1.5 
(b) K-means 聚 类 结果 
»à FCMclust clustering algorithms 


(c) FCMelust 聚 类 结果 
图 5-5 ”模糊 聚 类 算法 的 比较 ( 续 ) 
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GKclust clustering algorithms 


| 
e -0.5 0 0.5 1 15 
(d) GKchust 聚 类 结果 


图 5-5 ”模糊 聚 类 算法 的 比较 ( 续 ) 


其 中 ，*' 代 表 类 簇 的 聚 类 中 心 ， 错 分 样本 点 用 'o' 标 识 。 为 了 达 
到 可 视 化 效果 ， 二 维 空间 中 利用 等 高 线 图 描述 数据 分 布 。 从 图 中 可 
以 看 到 6 个 地 物 类 别 分 别 对 应 6 个 椭圆 形 集群 的 合 加 ， 由 于 GKcelust 
算法 通过 自 适 应 距离 拓展 了 FCMclust 算 法 使 得 椭 球 形 被 拉 长 ， 可 
以 明显 地 看 到 GKclust 算 法 中 错 分 类 别 的 点 集 明显 少 于 FCMclust 
和 KK-means 方 法 。 为 了 更 好 地 比较 3 种 聚 类 算法 对 该 研究 区 数字 集 
聚 类 的 不 同 效果 ， 表 5-3 也 列 出 不 同 聚 类 算法 所 产生 的 有 效 指数 及 
聚 类 精度 (Accuracy，ACC)。 从 表 5-3 不 难 发 现 ， 对 于 硬 聚 类 算法 
K-means，PC 和 CE 值 是 无 效 的 。 对 比 3 个 聚 类 指数 ，GKclust 算 法 
针对 这 一 数据 集 产生 的 结果 最 好 。 由 GKclust 产 生 的 聚 类 精度 也 比 
FCMclust 和 K-means 高 出 5% 以 上 。 因 此， 本 书 利用 GKclust 对 未 标记 
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样本 进行 优选 ， 以 提高 标注 效率 。 


表 5-3 聚 类 有 效 性 指数 值 


GKclust 0.690 5 0.6101 91.05 
FCMclust 0.641 8 0.777 6 85.23 
Kmeans 1 NaN 85.01 


55.4 ”无 标签 样本 的 参与 比例 


在 标签 样本 集 有 限 的 情况 下 ， 无 标签 样本 的 参与 可 以 改善 分 
类 性 能 。 然 而 ， 在 许多 情况 下 ， 过 多 或 无 效 的 无 标签 样本 可 能 会 降 
低 分 类 性 能 趾 。 为 了 观察 未 标记 样本 的 参与 是 否 对 分 类 精度 的 提高 
有 帮助 ， 以 及 如 何 搭 配 未 标记 样本 和 已 标记 样本 的 数目 ， 才 能 使 分 
类 的 投入 最 少 、 效 率 最 高 。 本 实验 分 别 选 取 了 不 同 标签 样本 和 无 标 
签 样本 组 合 。 具 体 为 分 别 从 每 个 类 别 独 立 选 取 25 个 、50 个 、75 个 、 
100 个 已 标记 样本 (150，300，450，600)， 以 及 整个 训练 样本 (894)， 
共存 储 为 5 个 已 知 标签 样本 集 ， 并 随机 选取 500 个 、1 000 个 、2 000 
个 、3 000 个 和 5 000 个 未 标记 样本 ， 存 储 为 5 个 未 知 标签 样本 集 ， 进 
行 半 监 督 分 类 实验 。 依 次 从 5 个 标记 样本 集 和 5 个 未 标记 样本 集中 选 
取 两 个 样本 集 组 合 进行 分 类 实验 ， 共 有 25 个 组 合 。 

25 个 组 合 利用 PS3VM，S3VM(FCMclust 模 糊 聚 类 的 半 监 督 
PSVM 简 称 ) 半 监督 分 类 结果 以 及 利用 PSVM 对 5 个 已 知 标签 样本 集 监 
督 分 类 结果 如 表 5-4 所 示 。 同 时 图 5-6(a) 一 (e) 列 出 3 种 方法 分 类 精度 随 
标签 样本 数量 变化 的 曲线 ， 图 5-6(G 显 示 50 组 实验 得 出 的 较 好 精度 下 
标签 样本 和 无 标签 样本 的 比例 图 。 从 表 5-4 和 图 5-6 观 察 可 得 出 如 下 
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重要 结论 : 

首先 ， 未 标记 样本 参与 的 半 监 督 分 类 方法 可 有 效 提高 已 标记 样 
本 代表 性 不 好 时 的 分 类 精度 (如 图 5-6(a) 一 (e) 所 示 )， 特 别 是 对 较 小 训 
练 样本 集 效 果 更 显著 。 

其 次 ， 随 着 已 标记 分 类 样本 的 增加 ， 未 标记 样本 的 作用 越 来 
越 小 。 从 表 5-4 分 类 精度 较 好 的 结果 可 知 ， 对 于 L=150，U=500 这 一 
组 合 (其 中 工 代表 标签 标本 数 ，U 代 表 无 标签 样本 数 )，PS3VM 所 获 
精度 82.92%， 而 PSVM 所 获 精度 为 75.23%， 即 PS3VM 分 类 精度 高 
于 PSVM 分 类 精度 7.69%; 随 着 标签 样本 数量 的 增多 ， 对 于 L=894， 
U-3 000 这 一 组 合 ，PS3VM 所 获 精度 为 95.10%， 而 PSVM 所 获 精度 
90.81%， 相 比 之 下 ，PS3VM 分 类 精度 高 于 PSVM 分 类 精度 4.29%。 

最 后 ， 从 实验 结果 可 以 看 出 ， 宛 余 的 无 标签 样本 可 能 会 降低 分 
类 精度 ， 例 如 ， 对 于 组 合 L=150，U=5 000，S3VM 所 获得 的 分 类 精 
度 甚 至 要 比 仅 使 用 标签 样本 (L=150) 的 PSVM 获 得 的 分 类 精度 还 低 ， 
也 就 是 说 ， 要 想 利用 半 监 督 分 类 获得 较 小 的 分 类 误差 ， 标 签 样本 和 
无 标签 样本 应 该 满足 一 定 的 比例 。 由 表 5-4 可 以 看 出 ， 对 于 PS3VM 
半 监 督 分 类 模型 ， 如 下 组 合 分 类 结果 较 好 ，L=150，U=500; 
L-300, U-1000; L-450, U-1000; L-600, U-2000; L-894, 
U=3 000; 对 于 S3VM 半 监督 分 类 模型 ， 如 下 组 合 分 类 结果 较 好 ， 
L-150, U-500; L=300, U-1000; L-450, U=2000; L-600, 
U-3000; L-894, U-3 000 产 生 的 分 类 精度 较 高 ， 按 照 规律 发 现 已 
标记 样本 和 未 标记 样本 之 间 保 持 的 合适 比例 关系 大 约 在 0.3(1:3) 左 右 
(如 图 5-6(f) 所 示 )。 
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ROA ”在 标签 样本 数量 变化 时 产生 的 分 类 精度 
Method L-150 | 1=300 | L=450 | 1-600 | 1=894 
82.92 8698 | 87.25 | 9058 


89.26 91.67 
PS3VM 91.64 92.92 
91.27 95.10 
88.92 93.61 
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Comparison of three methods(U=500) 
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图 5-6 三 种 方法 分 类 、 精 度 随 标签 样本 及 无 标签 样本 数量 变化 的 曲线 
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种 方法 分 类 、 精 度 随 标签 样本 及 无 标签 样本 数量 变化 的 曲线 ( 续 ) 


图 5-6 
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种 方法 分 类 、 精 度 随 标签 样本 及 无 标签 样本 数量 变化 的 曲线 ( 续 ) 


图 5-6 


|120| 基于 机 器 学 习 的 遥感 影像 分 类 方法 研究 


L/U ratio of better accuracy for PS3VM and S3VM 


L/U ratio of better accuracy 
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(f) 
图 5-6 三 种 方法 分 类 、 精 度 随 标签 样本 及 无 标签 样本 数量 变化 的 曲线 ( 续 ) 


ik: 图 5-6 其 中 (a)-(e) 为 3 种 方法 随 标签 样本 及 无 标签 样本 变化 曲线 ; 
(表示 PS3VM 与 S3VM 所 产生 较 好 精度 的 标签 和 无 标签 样本 比例 。 


表 5-5 ”三 种 方法 分 类 参数 、 分 类 精度 、kappa 系 数值 的 比较 
Method 


DCF 
DCF 


PS3VM 
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Overall 
Method | -c -y accuracy NW FL|RL DBLF|WT 


0 

0 

SERERE 0 

S3VM |35.63] 28.106 4|0.915 4] 93.06 Fer [ 7 loli] aa 5 
5 1 


PSVM |2221| 8.6340 |0.888 0| 90.81 


根据 上 述 实验 可 知 ， rere 3 000 个 无 标签 样本 
参与 的 组 合 ， 利 用 PS3VM 产 生 的 分 类 结果 最 好 。 为 了 比较 ， 针 对 这 
个 组 合 分 别 采用 S3VM 和 PSVM 分 类 器 进行 分 类 ， 其 结果 如 表 5-5 所 
示 ， 除 了 分 类 精度 值 ， 还 包括 参数 <、;y、Kappa 系 数 的 取 值 以 及 分 
类 混淆 和 矩阵。 从 表 5-5 可 以 发 现 ， 专 著 所 提出 的 PS3VM 方 法 相 比 其 
他 两 种 方法 性 能 更 优 。 


5.5.5 土地 覆盖 遥感 图 像 分 类 


利用 遥感 影像 的 数字 集 ， 有 效 地 测试 了 PS3VM 的 性 能 。 在 本 
节 ， 将 PS3VM 应 用 于 覆盖 研究 区 域 115-30TM 影 像 子 集 的 分 类 并 产 
生 分 类 专题 图 。 按 照 已 知 标签 样本 和 无 标签 样本 的 取 值 比例 (0.3)， 
针对 整个 测试 集 1 874 个 已 知 样本 点 ， 随 机 从 影像 上 搜集 6 000 个 未 
知 标签 点 进行 半 监 督 分 类 。 分 类 结果 如 图 5-7 所 示 。 
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FL RL ECF DBLF DCF WT 
图 5-8 三 种 方法 产生 的 子 专题 分 类 图 


YE: 图 中 圆圈 标 出 的 是 3 种 方法 分 类 差别 显著 位 置 。 
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从 图 中 可 以 得 出 如 下 结论 : 首先 ， 研 究 区 域 的 主要 土地 覆盖 类 
型 为 林地 ; 其次， 可 以 看 出 森林 正面 临 着 快速 城市 化 的 威胁 ， 为 了 
有 效 地 保护 森林 资源 ， 有 必要 对 此 研究 区 进行 动态 监测 。 

此 外 ， 为 了 观察 3 种 算法 对 遥感 影像 数据 分 类 精度 的 差异 ， 专 
著 从 分 类 专题 图 中 抽取 几 个 典型 区 域 用 于 比较 ， 其 分 类 专题 的 子 集 
图 如 图 5-8 所 示 。3 种 算法 明显 的 分 类 差异 用 黑色 的 圆圈 标识 ， 从 左 
到 右 依次 采用 PS3VM、S3VM、SVM 分 类 方法 。 从 第 一 列 能 够 看 
到 ，PS3VM 能 较 好 地 解决 针 叶 林 和 阔 叶 林 混合 像素 的 分 类 。 第 二 
列 ，PS3VM 方 法 在 耕地 和 城市 用 地 ， 及 林地 之 间 的 分 类 精度 也 明显 
高 于 其 他 两 种 方法 。 从 子 专题 图 中 也 不 难 发 现 ， 利 用 SVM 方法 很 难 
解决 常 绿 针 叶 林 与 阴影 之 间 的 混合 像素 分 类 识别 问题 。 

综 上 可 知 ，PS3VM 在 遥感 影像 数据 上 的 分 类 也 明显 优 于 其 他 两 
种 方法 ， 无 标签 的 样本 有 效 加 入 确实 能 提高 影像 的 分 类 精度 。 


5.6 ACA 


在 遥感 影像 分 类 领域 ， 构 建 出 高 精度 、 高 性 能 的 分 类 器 通常 不 
是 一 件 容易 的 事情 ， 因 为 任何 分 类 模型 的 创建 都 离 不 开 充足 的 、 准 
确 的 训练 样本 ， 训 练 样本 的 获取 不 但 费时 、 费 力 ， 而 且 还 可 能 由 于 
训练 样本 人 为 主观 选择 而 产生 已 知 样本 的 不 准确 性 。 半 监督 学 习 很 
好 地 解决 了 因 样 本 不 足 而 造成 分 类 器 性 能 低下 这 一 问题 。 本 文 提出 
一 种 新 的 利用 自 训练 算法 融合 启发 式 算法 的 半 监 督 SVM 分 类 模型 ， 
并 且 在 标签 样本 的 标注 过 程 中 ， 引 入 了 GKclust 模 糊 聚 类 算法 ， 主 要 
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目的 在 于 通过 无 标签 样本 的 合理 利用 以 及 准确 的 分 类 参数 获得 分 类 
性 能 高 的 分 类 模型 。 并 且 将 所 提 到 的 半 监 督学 习 模 型 分 别 应 用 于 般 
感 的 数字 数据 和 影像 数据 的 分 类 实验 ， 可 以 得 出 如 下 结论 : 

(1) 无 标签 样本 参与 能 够 提高 分 类 器 的 分 类 性 能 ， 但 其 数量 要 
满足 一 定 的 比例 ， 

(2) 针对 本 书 所 提供 的 数据 集 分 布 特点 ，GKclust 算 法 相 比 于 
FCMclust、K-means 算 法 确实 有 较 高 的 聚 类 性 能 ; 

(3) 从 分 类 比较 结果 可 以 看 出 ，PS3VM 能 够 有 效 克 服 自 训练 半 
监督 模型 中 “错误 累积 ”这 一 弊端 ， 能 够 明显 提高 数据 集 的 分 类 
精度 。 
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8$6.1 概述 


半 监 督学 习 利用 未 标记 样本 所 隐 含 的 地 物 类 型 在 特征 空间 中 的 
结构 信息 ， 拟 合 出 一 个 更 有 代表 性 的 分 类 器 中， 集成 学 习 外 综合 多 
个 同 构 或 异 构 学 习 机 对 同一 个 问题 进行 学 习 ， 进 而 提高 分 类 器 的 泛 
化 能 力 ， 二 者 采用 截然 不 同 的 思维 观 ， 其 发 展 几乎 是 并 行 的 ， 只 有 
少数 研究 涉及 二 者 的 结合 路 。 但 是 ， 集 成 学 习 与 半 监 督学 习 之 间 
存在 许多 互补 关系 中 5， 具体 表现 在 ; 

(1) 当 单 个 分 类 器 无 法 通过 无 标签 样本 参与 训练 提高 分 类 精度 
时 ， 分 类 器 的 融合 可 以 进一步 改善 单个 分 类 器 的 不 足 ; 

(2) 使 用 未 标记 数据 能 够 增加 个 体 分 类 器 之 间 的 差异 性 ， 从 而 
可 获得 高 效 的 集成 分 类 模型 ; 

(3) 分 类 器 的 集成 能 够 比 单个 分 类 器 更 快 地 达到 理想 的 分 类 精 
度 。 因 此 ， 如 何 设计 有 效 的 半 监 督 集成 方案 是 改进 学 习 系统 泛 化 能 
力 的 另 一 个 崭新 思路 br 。 

第 5 章 通 过 自 适应 半 监 督学 习 把 大 量 无 标签 样本 所 包含 的 数据 
特征 加 入 SVM 学 习 算 法 的 设计 中 ， 弥 补 单个 监督 分 类 器 的 不 足 ， 同 
时 也 产生 若干 性 能 差异 的 个 体 分 类 器 。 本 章 探讨 如 何 将 这 些 个 体 分 
类 器 集成 ， 进 一 步 提 高 分 类 模型 的 泛 化 能 力 。 


5$62 ”集成 学 习 框 架 


Krogh 和 Vedelsbyo 给 出 神经 网 络 集成 泛 化 误差 计算 公式 ， 假 
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设 学 习 任 务 是 由 入 个 神经 网 络 组 成 对 f : R RETEN, RERA 
加 权 平 均 ， 各 分 类 器 分 别 赋 以 权 值 w。， 并 且 满足 如 下 条 件 : 
Èw 71, w>0 (6-1) 
再 假设 训练 集 的 每 个 样 例 按 概率 分 布 pG) 随 机 抽取 ， 分 类 器 4 对 
输入 X 的 输出 为 "CY)， 则 集成 输出 为 : 


V(X)= Y wy oo (6-2) 
神经 网 络 a 的 泛 化 误差 8" 和 神经 网 络 集成 的 泛 化 误差 E 分 别 为 : 
E* = [pC (0) -V* G9) dx (6-3) 
E= | p@S@)-Va)yax (6-4) 
分 类 器 个 体 x 的 差异 度 4 和 集成 的 差异 度 了 分别 为 : 
A = | POVE) -V GO dx (6-5) 
A- »» w,A" (6-6) 
则 最 终 的 集成 泛 化 误差 为 : 
E=E-A (6-7) 


EE 表示 个 体 分 类 器 固有 误差 ，4 表 示 个 体 分 类 器 之 间 的 差异 。 该 
公式 表明 要 获得 较 好 的 集成 结果 就 需要 降低 个 体 分 类 器 的 误差 并 增 
加 个 体 分 类 器 之 间 的 差异 。 因 此 ， 集 成 学 习 框 架 的 设计 通常 由 以 下 
两 部 分 构成 : 采用 一 定 的 个 体 生 成 方法 ， 研 究 如 何 根据 指定 训练 集 生 
成 集成 中 多 个 、 有 差异 个 体 分 类 器 ; 采用 一 定 的 结论 合成 方法 ， 研 究 
怎样 将 多 个 个 体 分 类 器 的 输出 进行 合成 ， 得 到 集成 学 习 的 最 终结 果 。 


6.2.1 个 体 生成 方法 


如 何 构造 集成 中 的 个 体 分 类 器 对 集成 的 性 能 有 重大 影响 ， 目 前 
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的 方法 主要 有 以 下 9 种 。 

1. 基于 数据 划分 方法 

通过 划分 训练 样本 集合 产生 多 个 训练 样本 子 集 ， 学 习 算 法 分 
别 在 这 些 训练 样本 子 集 上 进行 训练 ， 生 成 多 个 个 体 分 类 器 。 典 型 算 
法 主要 有 Bagging 算 法 (1 和 Boosting 算 法 中 ， 它 们 也 是 目前 集成 学 习 
算法 中 最 著名 的 两 种 方法 。Lima 等 人 中 将 Bagging 集 成 技术 引入 到 
SVM 回 归 分 析 中 ， 实 验证 明 其 泛 化 能 力 有 所 提高 。He 等 人 中 比较 了 
不 同 SVM 集 成 方法 ， 并 在 Boosting 算 法 基础 上 给 出 一 种 DBoosting 算 
法 。 实 验 结果 表明 ，DBoosting 算 法 比 其 他 算法 有 更 好 的 性 能 。 

2. 基于 属性 划分 方法 

把 输入 特征 空间 划分 为 多 个 特征 子 集 ， 在 不 同 特征 子 集 上 投影 
得 到 的 训练 样本 用 于 训练 生成 多 个 个 体 分 类 器 。 李 国正 等 人 中 运 用 
特征 选择 对 Bagging 方 法 中 bootstrap 方 法 产生 的 训练 样本 子 集 进行 特 
征 选择 ， 分 别提 出 PRIFEB 和 MIFEB 两 种 算法 ， 从 而 提高 了 个 体 的 
差异 度 和 精度 。Brylia 等 人 中 提出 Attribute-Bagging 方 法 ， 利 用 随机 
方法 产生 特征 子 集 来 获得 集成 个 体 之 间 更 大 的 差异 度 。 

3. 基于 分 类 器 模型 参数 方法 

分 类 参数 对 分 类 精度 有 重要 影响 ， 设 置 不 同 参数 值 可 以 获得 不 
同 泛 化 能 力 的 分 类 模型 。 何 灵敏 0" 提出 基于 参数 与 样本 二 重 扰动 机 
制 的 集成 学 习 算法 ， 在 Bagging 和 Boosting 算 法 中 媒 入 高 斯 核 函 数 宽 
度 参数 1 和 惩罚 参数 c 扰 动机 制 。Li 等 人 叫 将 扰动 径 向 基 核 函数 宽度 
参数 方式 引入 到 AdaBoost 算 法 中 ， 利 用 新 的 SVM 集成 算法 产生 有 差 
异 的 个 体 SVM， 从 中 选择 出 部 分 差异 度 较 大 的 个 体 参与 集成 ， 试 验 
结果 表明 该 方法 能 显著 提高 分 类 精度 。 
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62.2 ”结论 生成 方法 


结论 生成 方法 主要 研究 如 何 对 集成 中 个 体 分 类 器 所 给 出 的 结论 
进行 合成 。 目 前 主要 采用 的 方法 有 以 下 几 种 。 

1. 全 部 生成 的 分 类 器 个 体 都 参与 集成 的 投票 法 

主要 包括 多 数 投票 法 和 加 权 投 票 法 ， 通 常 投票 法 更 适合 分 类 
集成 四。 

(1) 多 数 投票 法 (Majority Voting) 

基本 思想 是 多 个 基 分 类 器 进行 分 类 预测 ， 通 过 某 种 投票 原则 进 
行 投票 表决 ， 是 最 简单 ， 也 是 最 普遍 的 结论 合成 方法 。 每 个 成 员 分 
类 器 对 于 待 测 样本 x 有 一 个 类 别 的 判断 ， 并 给 所 判断 的 待 测 样本 x 的 
归属 类 别 投 一 票 ， 设 入 为 将 待 测 样本 x 判定 给 第 ;类 的 个 体 分 类 器 个 
数 ， 那 么 最 后 的 判决 函数 是 : 

f CD)=arg max(N) (6-8) 

(2) 加 权 投 票 法 (Weighted Voting) 

加 权 投票 法 是 将 每 个 成 员 分 类 器 均 赋 予 一 定 的 权重 ， 权 重 通 
过 在 训练 集 上 测量 每 个 成 员 分 类 器 精度 获得 ， 且 权重 与 精度 成 正 
比 ， 即 分 类 能 力 好 的 基 分 类 器 被 赋予 较 大 的 权 系数 ， 而 分 类 能 力 相 
对 差 的 基 分 类 器 赋予 较 小 的 权 系数 ， 集 成 的 结果 取决 于 加 权 和 。 设 
ji(1，2，…， 刀 是 第 ! 个 成 员 分 类 器 的 决策 函数 ，w(F=1，2，…， 
DD 是 相应 的 权重 ， 则 最 后 的 决策 如 下 所 示 : 


f(x)=sign 区 wh, e) (6-9) 


Yan 等 人 已 提出 类 别 数目 不 均 的 SVM 集成 ， 其 集成 方案 是 将 
大 样本 的 负 类 样本 分 成 K 等 分 ， 与 小 样本 的 正 类 样本 合成 一 个 训练 
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样本 集 ， 在 其 上 训练 生成 KE 个 体 分 类 器 ， 最 后 用 多 数 投票 法 进行 集 
成 。Kim 等 人 5 结合 Bagging 和 Boosting 生 成 个 体 SVM 分 类 器 ， 并 比 
较 了 多 数 投 票 法 、 加 权 投票 法 和 两 层 SVM3 种 分 类 方式 ， 实 验 结果 
表明 ，3 种 方法 都 能 获得 比 单个 SVM 更 好 的 泛 化 性 能 。 

2. 从 集成 中 选择 出 部 分 个 体 的 选择 性 集成 学 习 算 法 

选择 集成 算法 基于 “Many Could Be Better Than All” P?, £48 
思想 就 是 利用 对 多 个 学 习 器 进行 适当 的 选择 来 剔除 对 学 习 系 统 有 副 
作用 的 学 习 器 ， 最 后 将 所 选择 的 结果 进行 结合 ， 从 而 得 到 性 能 更 好 
的 学 习 器 。Zhou 等 人 PR9 提 出 了 相应 的 选择 性 集成 算法 GASEN， 其 
理论 分 析 和 实验 结果 均 表 明 ， 该 算法 性 能 优 于 Boosting 和 Bagging 算 
法 。He 等 人 中 "提出 基于 遗传 算法 的 选择 性 SVM 集 成 方法 ， 从 集成 中 
选择 出 部 分 个 体 参 与 集成 ， 得 到 比 全 部 个 体 都 参与 集成 更 好 的 性 能 。 


潮 6.3 ” 半 监 督 集成 支持 向 量 机 的 土地 
履 盖 分 类 模型 构建 


针对 上 述 分 析 ， 本 文 从 个 体 生成 (使 用 程序 来 生成 个 体 分 类 器 ) 
和 结论 生成 (选择 特定 的 策略 来 组 合 分 类 器 ) 两 个 部 分 考虑 ， 提 出 半 
监督 集成 SVM 分 类 策略 。 具 体 技术 路 线 如 下 : 第 一 ， 个 体 生 成 部 
分 一 方面 利用 自 适应 变异 粒子 群 算法 (Self-adaptive Mutation PSO， 
SAMPSO) 优 化 SVM 分 类 器 参数 以 获得 高 精度 分 类 器 个 体 ， 另 一 方 
面 采用 Gustafson-Kessel(GKclust) 模 糊 聚 类 算法 控制 Self-training 错 误 
标记 样本 的 加 入 以 提高 个 体 分 类 器 的 差异 性 ， 第 二 ， 结 论 生成 部 
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分 采用 加 权 投 票 策略 将 半 监 督 分 类 器 个 体 集成 。 具 体 描述 如 图 6-1 
所 示 : 


AMPSO 算 法 Gkclust 算 法 l 


| + 
| SVM 分 类 器 (PSVMD) 


< 一 个 体 生成 


b a 
Self-training 自 训练 半 监 督 算法 


| | PS3VM! PS3VM?| … | PS3VM"| | 


| [^ 个 体 分 类 器 集成 一 
,加权 投 票 法 
| Te tre | SEEDS 


图 6-1 半 监 督 集成 SVM 分 类 模型 技术 路 线 


6.3.1 个 体 生成 算法 


第 5 章 所 构建 的 PS3VM 分 类 模型 ， 以 PSVM 作 为 自 训练 算法 的 
基 分 类 器 ， 在 自 训练 算法 未 标记 样本 标注 过 程 中 ， 利 用 GKclust 模 
糊 聚 类 算法 控制 错误 类 别 样本 的 标注 ， 提 高 分 类 器 的 分 类 精度 ， 同 
时 也 迭代 产生 了 多 个 半 监 督 分 类 器 个 体 PS3VM'，PS3VM”， 
PS3VM"( 算 法 详 见 第 5 章 )。 
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6.3.2 结论 生成 算法 


集成 学 习 主要 思想 是 利用 分 类 器 的 融合 改善 单个 分 类 器 的 不 
足 ， 其 性 能 一 方面 取决 于 多 样 性 强 的 个 体 学 习 器 ， 另 一 方面 依赖 于 
成 员 分 类 器 的 有 效 组 合 。 接 下 来 专著 利用 加 权 投 票 法 将 这 些 个 体 分 
类 器 集成 ， 进 一 步 提 高 分 类 模型 的 泛 化 能 力 。 在 此 ， 将 集成 的 半 监 
督 分 类 模型 简称 EPS3VM。 

假设 利用 自 训练 算法 产生 T 个 分 类 器 个 体 : S, S, f, ST 一 
幅 遥 感 影 像 分 类 问题 包含 C 个 类 别 。 

EPS3VM 算 法 步骤 如 下 : 

Stepl: 将 各 基 分 类 器 9，S，…，S 的 分 类 混淆 矩阵 获得 的 各 
类 别 的 用 户 精度 作为 权 值 W( 二 1，2，…，T; 产 1]，2，…，O 〇 ); 

Setp2: 各 基 分 类 器 对 未 知 像 元 X 分 类 后 ， 将 分 类 结果 相同 的 各 
基 分 类 器 对 该 类 别 的 权 值 相 加 ， 即 得 到 像 元 X 属 于 各 类 别 的 权 值 之 


MWU = 2, = H); 
Setp3: 比较 权 值 之 和 的 大 小 ， 将 最 大 值 对 应 的 类 别 作为 像 元 X 
的 最 终 类 别 标签 。 


庙 6.4 实验 结果 与 分 析 


为 了 测试 EPS3VM 分 类 模型 性 能 ， 将 半 监 督 集成 模型 应 用 于 
多 光谱 遥感 影像 的 土地 覆盖 分 类 实验 ， 同 时 与 PSVM、PS3VM 进 行 
对 比 。 
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6.4.1 实验 数据 


本 文选 择 2006 年 9 月 22 日 获取 行列 号 115-30 多 光谱 Landsat-5 TM 
遥感 影像 (30 米 空间 分 辩 率 ，UTM 投 影 )。 根 据 植被 的 光谱 特征 和 空 
间 分 布 规律 ， 本 文 提 取 了 8 个 特征 ， 包 括 TM 图 像 的 6 个 波段 (1~~5，7)、 
PCA 变 换 的 第 一 主 分 量 、 植 被 指数 QNDVD。 

据 研究 区 实际 情况 并 参照 第 3 章 介绍 的 土地 覆盖 分 类 系统 一 级 
类 型 ， 将 实验 区 分 为 5 个 土地 覆盖 类 型 ， 即 森林 、 水 体 、 农 田 、 人 
工 表面 及 其 他 。 为 了 保证 每 个 类 别 数据 的 变化 性 和 代表 性 ， 数 字 集 
采用 随机 像素 的 选择 策略 。 土 地 覆盖 类 型 及 样本 数量 如 表 6-1 所 示 。 


表 6-1 ”类别 及 样本 数量 

类 别 代号 样 本 
m 334 
229 
268 
190 
229 
1250 


e» 
95 
a 
05 


类 别 及 样本 总 数 


642 ”结果 与 精度 分 析 


当 训 练 样本 较 少 时 ， 未 标记 样本 参与 的 半 监 督 分 类 方法 可 有 
效 提高 分 类 精度 ， 但 随 着 已 标记 分 类 样本 的 增加 ， 未 标记 样本 的 作 
用 越 来 越 小 。 首 先 为 了 更 好 地 体现 小 样本 特点 ， 将 随机 抽取 少 部 分 
样本 作为 训练 样本 ( 占 每 类 样本 的 30%)， 整 个 数据 集 用 于 测试 。 分 
别 采用 PSVM、PS3VM、EPS3VM 3 种 分 类 模型 进行 对 比 实验 ， 将 
分 类 精度 、Kappa 系 数 及 相应 的 参数 值 列 于 表 6-2。 实 验 结果 表明 ， 
使 用 EPS3VM 方 法 分 类 得 到 的 分 类 精度 比 PS3VM 模 型 高 出 4.72%， 
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比 PSVM 模 型 高 出 8.4%，Kappa 系 数 也 要 分 别 高 于 PS3VM 模 型 
0.059 6， 高 于 PSVM 模 型 0.106。 表 6-3 显 示 3 种 方法 不 同类 别 的 混淆 
矩阵， 实验 结果 均 证 实 EPS3VM 能 有 效 提高 影像 的 分 类 精度 。 

表 6-2 分 类 参数 、 分 类 精度 和 kappa 系 数 的 比较 


分 类 模型 | 惩罚 参数 c | 核 函 数 参数 / | 分 类 精度 (%) | Kappa 系 数 


PSVM | 52.6312 27.1031 88.48 0.854 6 
PS3VM 24.060 2 12.8923 92.16 0.901 0 
EPS3VM 
表 6-3 ”三 种 方法 的 混淆 矩阵 
PSVM Wi Ws 
Wi 334 0 
[77 0 60 
W3 5 20 
Wa 0 9 
Ws 3 199 
PS3VM Wi Ws 
Wi 334 0 
0)» 0 35 
W3 3 8 
Wa 0 8 
Ws 5 203 
EPS3VM Wi Ws 
w 334 0 
W 0 0 
Ws 1 Ei 
Wa 0 6 
Ws 3 213 


上 述 实 验 利 用 遥感 影像 的 数字 集 ， 有 效 地 测试 了 EPS3VM 的 性 
能 。 在 本 实验 中 ， 将 3 种 分 类 模型 应 用 于 覆盖 研究 区 域 115-30 的 TM 
影像 子 集 的 分 类 ， 并 产生 分 类 专题 图 ， 分 类 结果 如 图 6-2 所 示 。 由 于 
研究 区 主要 土地 覆盖 类 型 为 植被 ， 因 此 ， 图 6-2(a) 为 研究 区 5、4、3 
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波段 合成 图 ， 图 6-2(b) 显 示 PSVM 分 类 结果 ， 其 中 1 250 个 样本 点 作 
AWA: 图 6-2(c) 和 图 6-2(d) 以 1 250 样 本 点 作为 已 知 样本 点 ， 并 随 
机 从 影像 上 搜集 3 000 个 未 知 标签 点 进行 半 监 督 分 类 和 半 监 督 集成 分 
类 。 从 分 类 图 中 可 以 看 出 ， 研 究 区 域 的 主要 士 地 覆盖 类 型 为 林地 。 
比较 3 种 分 类 图 ， 不 难 发 现 PSVM 分 类 模型 在 林地 和 耕地 存在 错 分 现 
象 ，PS3VM 主 要 问题 在 于 耕地 、 裸 地 和 住宅 分 类 错误 ， 而 EPS3VM 
在 遥感 影像 数据 上 的 分 类 明显 优 于 其 他 两 种 方法 。 


A s 


(a) 5、4、3 波 段 合成 (b) PSVM 分 类 


iy 


w= 7 > wl 
(c) PS3VM 分 类 (d) EPS3VM 分 类 


森林 kk 农田” 人工 表面 其 他 
图 6-2 三 种 分 类 方法 对 TM 影像 子 集 产生 的 分 类 专题 图 
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8865. AA 


构建 性 能 良好 的 分 类 器 集成 ， 可 以 获得 比 单个 分 类 器 更 好 的 学 
习性 能 和 泛 化 能 力 。 通 常 需要 满足 的 充 要 条 件 是 : 

(1) 需要 足够 高 的 个 体 分 类 器 精度 ， 其 分 类 精度 是 指 对 于 一 个 
新 的 数据 进行 函数 逼近 或 分 类 ， 它 的 误差 率 要 比 随机 猜测 好 ; 

(2) 个 体 分 类 器 之 间 要 有 一 定 差异 度 ， 其 差异 度 指 的 是 对 于 新 
的 数据 点 进行 函数 逼近 或 分 类 时 ， 它 们 的 错误 是 不 相关 的 。 

本 书 从 以 上 两 个 方面 考虑 ， 提 出 基于 半 监 督 集成 SVM 分 类 方 
法 。 该 方法 有 如 下 特点 

(1) 以 PSVM 模 型 作为 基 分 类 器 ， 利 用 Self-training 算 法 产生 半 监 
督 分 类 器 个 体 ， 其 中 在 半 监 督学 习 过 程 中 为 了 避免 错误 样本 的 加 入 
引入 GKclust 模 糊 聚 类 算法 。 

(2) 半 监 督学 习 和 集成 学 习 两 种 范式 的 结合 ， 一 方面 充分 利用 
大 量 廉价 的 未 标记 样本 ， 以 减少 对 有 标记 样本 的 需求 量 ， 另 一 方 
面 ， 未 标记 数据 能 够 增加 个 体 分 类 器 之 间 的 差异 性 ， 从 而 进一步 提 
高 学 习 系统 的 泛 化 能 力 。 

(3) 利用 所 提 模 型 解决 蜗 感 土地 覆盖 分 类 实验 表明 ， 在 相同 样 
本 数量 条 件 下 ， 相 比 于 其 他 分 类 技术 ， 该 模型 能 获取 更 丰富 、 更 准 
确 的 遥感 类 别 信息 。 同 时 ， 本 文 算法 亦 存在 一 些 有 待 改 进 之 处 。 例 
如 ， 在 个 体 分 类 器 集成 部 分 ， 对 权 系 数 产 生 的 问题 上 ， 可 采用 更 有 
效 的 策略 。 
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571 研究 结论 


土地 有 覆盖 变化 的 研究 是 全 球 环境 研究 的 热点 ， 与 人 类 生产 生 
活 、 生 态 环境 密切 相关 。 土 地 覆盖 遥感 信息 的 获取 不 仅 要 靠 日 益 发 
展 的 遥感 技术 ， 更 要 依赖 于 先进 的 信息 提取 方法 。 因 此 ， 探 索 新 的 
遥感 分 类 理论 与 分 类 方法 一 直 是 国内 外 学 者 关注 的 焦点 。 本 书 以 现 
有 SVM 为 基础 ， 深 入 分 析 其 遥感 分 类 领域 的 研究 现状 及 不 足 ， 融 合 
智能 算法 、 模 糊 聚 类 算法 、 半 监督 学 习 、 集 成 学 习 理论 ， 探 讨 新 的 
土地 覆盖 遥感 分 类 方法 。 实 验证 明 ， 智 能 算法 、 模 糊 理论 、 半 监督 
学 习 、 集 成 学 习 理论 的 引入 ， 实 现 了 算法 的 相互 融合 ， 优 势 互 补 ， 
进一步 提高 了 土地 覆盖 遥感 信息 提取 的 精度 ， 丰 富 了 机 器 学 习 理 论 
在 遥感 信息 提取 与 识别 方面 的 理论 基础 和 应 用 研究 。 对 于 土地 覆盖 
遥感 数据 信息 提取 具有 较 强 的 理论 意义 和 实用 价值 。 

本 书 的 主要 研究 内 容 及 结论 如 下 : 

(1) 参数 选择 是 任何 机 器 学 习 方 法 都 必须 面 对 的 重要 而 困难 
的 问题 。 设 置 合适 的 SVM 参数 对 提高 遥感 影像 分 类 精度 是 非常 重 
要 的 。 针 对 这 一 问题 ， 专 著 提出 一 种 自 适 应 变异 粒子 群 (Adaptive 
Mutation Particle Swarm Optimization，AMPSO) 优 化 SVM 参数 模 
型 。 与 传统 粒子 群 算法 (Particle Swarm Optimization，PSO) 相 比 ， 
AMPSO 在 运行 过 程 中 根据 群体 适应 度 方 差 以 及 当前 最 优 解 的 大 小 
来 确定 当前 最 佳 粒子 的 变异 概率 ， 避 免 了 传统 PSO 因 早熟 收敛 造成 
分 类 参数 寻找 不 准确 的 缺点 。 最 后 应 用 该 模型 进行 多 光谱 遥感 影像 
的 土地 覆盖 分 类 试验 ， 并 与 最 大 似 然 法 、SVM 分 类 方法 、 传 统 PSO- 
SVM 3 种 分 类 方法 进行 对 比 实验 ， 结 果 表明 所 提 模 型 能 够 有 效 提高 
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遥感 影像 的 分 类 精度 。 

(2) 准确 且 充 足 的 训练 样本 是 影响 SVM 分 类 精度 的 另 一 个 重要 
因素 。 遥 感 影像 本 身 具有 高 度 的 复杂 性 和 随机 性 特点 ， 此 外 ， 训 练 
样本 是 分 析 者 人 为 选取 的 ， 不 论 现场 踏勘 还 是 参考 已 有 专题 图 件 或 
其 他 资料 ， 总 是 存在 经 验 、 知 识 有 限 和 盲目 选择 的 缺点 ， 从 而 造成 
所 选择 的 分 类 样本 不 足 且 无 法 保证 对 影像 中 相应 地 物 的 代表 性 。 针 
对 这 一 问题 ， 本 书 提出 了 一 个 新 的 自 训 练 PSVM 方 法 ， 利 用 自 训练 
半 监 督 技术 充分 挖掘 未 标记 样本 所 蕴涵 的 结构 信息 ， 以 此 对 已 标记 
样本 数量 不 足 且 代表 性 不 好 而 造成 的 拟 合 分 类 器 有 偏差 的 情况 进行 
娇 正 。 为 了 解决 遥感 影像 混合 像 元 分 类 困难 问题 ， 在 标注 未 标记 样 
本 阶段 ， 引 入 模糊 聚 类 技术 ， 以 控制 错误 信息 的 输入 ， 同 时 利用 自 
适应 变异 粒子 群 算法 对 SVM 人 参数 优化 以 提高 半 监 督 模型 基 分 类 器 的 
分 类 精度 。 为 了 测试 提出 模型 的 有 效 性 ， 分 别针 对 遥感 的 数字 集 和 
影像 集 进行 分 类 实验 ， 并 与 传统 SVM 监督 分 类 方法 、 未 改进 自 训练 
半 监 督 SVM 方法 进行 对 比 实验 ， 实 验 结果 一 方面 说 明了 已 标记 样本 
和 未 标记 样本 的 用 量 比例 必须 满足 一 定 的 阔 值 要 求 ， 才 能 产生 最 小 
的 泛 化 误差 ， 另 一 方面 证 实 了 利用 所 提出 学 习 框架 能 够 有 效 地 克服 
由 于 样本 不 足 且 代表 性 不 好 而 导致 分 类 精度 低下 的 问题 。 

(3) 为 了 进一步 提高 分 类 器 的 泛 化 能 力 ， 本 书 将 集成 学 习 技术 
引入 半 监 督 分 类 模型 ， 提 出 了 一 种 新 的 半 监 督 集成 方案 ， 主 要 设计 
思想 在 于 : 半 监 督 分 类 方法 利用 未 标记 数据 有 效 地 应 对 训练 样本 不 
足 缺 点 的 同时 ， 也 产生 若干 性 能 差异 的 个 体 分 类 器 ， 将 这 些 个 体 分 
类 器 加 权 投 票 集成 。 为 了 测试 其 性 能 ， 应 用 该 模型 进行 多 光谱 遥感 
影像 的 土地 覆盖 分 类 实验 ， 结 果 表 明 ， 半 监督 技术 与 集成 技术 的 有 
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效 融 合 能 进一步 改善 分 类 器 的 分 类 精度 。 

综 上 所 述 ， 本 书 将 智能 算法 、 模 糊 集 理论 以 及 半 监 督 与 集成 学 
习 引 入 SVM 分 类 中 ， 提 高 了 SVM 分 类 器 的 分 类 精度 ， 丰 富 了 土地 覆 
盖 信 息 提 取 方 法 ， 促 进 了 相关 领域 的 发 展 和 进步 。 


8$72 本 书 不 足 之 处 


本 书 利用 半 监 督学 习 及 集成 学 习 理 论 融合 SVM 分 类 器 ， 解 决 了 
SVM 分 类 模型 在 遥感 影像 分 类 中 所 表现 的 不 足 ， 对 其 土地 覆 尊 分 类 
提取 技术 研究 有 一 定 意义 ， 然 而 ， 仍 存在 如 下 有 待 改进 之 处 : 

(1) 遥感 影像 的 数字 化 部 分 ， 考 虑 到 时 间 复 杂 度 ， 所 选 分 类 特 
征 略 显 不 足 ， 遥感 数据 源 单一 ， 仅 针对 一 景 的 多 光谱 遥感 影像 ， 缺 
乏 多 数据 源 的 融合 。 

(2) 所 提 理 论 在 遥感 的 分 类 精度 上 有 所 提高 ， 然 而 时 间 复 杂 度 
却 不 是 很 理想 ， 分 类 模型 时 间 复 杂 度 有 待 进一步 提高 。 


“7.3 研究 展望 


本 书 对 半 监 督 集 成 SVM 方法 在 土地 遥感 分 类 研究 领域 做 了 初步 
的 探讨 ， 形 成 了 初步 的 成 果 。 鉴 于 该 理论 的 优点 ， 未 来 必 将 促进 土 
地 遥感 分 类 技术 及 相关 领域 的 进步 和 发 展 。 

(1) 半 监 督 集成 SVM 模型 能 有 效应 对 小 样本 问题 ， 适 合 解决 如 
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跨 境地 区 的 影像 的 识别 ， 因 为 跨 境 区 域 的 样本 获取 条 件 更 为 苛刻 ， 
无 法 现场 获取 已 知 样 本 点 ， 境 外 样本 的 来 源 便 寄 托 于 与 境内 影像 条 
件 相 似 的 覆盖 区 域 的 影像 ， 由 此 造成 样本 数量 不 足 且 代表 不 好 。 

(2) 多 种 学 习 技术 融合 的 思想 进一步 扩 宽 算法 研究 的 思路 。 随 
着 计算 机 技术 的 不 断 发 展 ， 遥 感 分 类 方法 层出不穷 ， 每 个 分 类 算法 
都 各 具 优 缺 点 。 将 有 效 的 算法 相互 融合 ， 取 长 补 短 ， 更 具有 实际 的 
应 用 价值 。 


